比ChatGPT更强大 微软推出全能型人工智能模型 Kosmos-1
IT之家消息,基于 ChatGPT 的必应聊天已经让不少用户感受到了 AI 的强大,而微软于近日推出了更为强悍的全能型 AI--Kosmos-1。ChatGPT 是纯文本 LLM,而它是更强大的多模式大型语言模型(MLLM)。 Kosmos-1 可以分析图像的内容、解决视觉难题、执行视觉文本识别、通过视觉智商测试以及理解自然语言指令等等。据悉,Kosmos-1 可以处理文本、音频、图像和视频等内容,构建一个全能型的人工智能,可以像人类思维一样来处理任务。 研究人员在他们的学术论文中写道:“作为智能的基本组成部分,多模态感知是实现人工智能的必要条件”。Kosmos-1 论文中的视觉示例显示模型分析图像并回答有关图像的问题,从图像中读取文本,为图像编写标题,并以 22-26% 的准确度进行视觉智商测试。 微软表示,它计划向开发人员提供 Kosmos-1,尽管该论文引用的GitHub页面在本文发表时没有明显的 Kosmos 特定代码。 获取更多RSS:https://feedx.net https://feedx.best
![比ChatGPT更强大 微软推出全能型人工智能模型 Kosmos-1](https://img.3dmgame.com/uploads/images/news/20230304/1677913629_468636.jpg)
IT之家消息,基于 ChatGPT 的必应聊天已经让不少用户感受到了 AI 的强大,而微软于近日推出了更为强悍的全能型 AI--Kosmos-1。ChatGPT 是纯文本 LLM,而它是更强大的多模式大型语言模型(MLLM)。
Kosmos-1 可以分析图像的内容、解决视觉难题、执行视觉文本识别、通过视觉智商测试以及理解自然语言指令等等。据悉,Kosmos-1 可以处理文本、音频、图像和视频等内容,构建一个全能型的人工智能,可以像人类思维一样来处理任务。
研究人员在他们的学术论文中写道:“作为智能的基本组成部分,多模态感知是实现人工智能的必要条件”。Kosmos-1 论文中的视觉示例显示模型分析图像并回答有关图像的问题,从图像中读取文本,为图像编写标题,并以 22-26% 的准确度进行视觉智商测试。
微软表示,它计划向开发人员提供 Kosmos-1,尽管该论文引用的GitHub页面在本文发表时没有明显的 Kosmos 特定代码。
![like](https://news.axiox.net/assets/img/reactions/like.png)
![dislike](https://news.axiox.net/assets/img/reactions/dislike.png)
![love](https://news.axiox.net/assets/img/reactions/love.png)
![funny](https://news.axiox.net/assets/img/reactions/funny.png)
![angry](https://news.axiox.net/assets/img/reactions/angry.png)
![sad](https://news.axiox.net/assets/img/reactions/sad.png)
![wow](https://news.axiox.net/assets/img/reactions/wow.png)