2)多图:在多图评测权威平台Mantis-Eval榜单上,MiniCPM-V 2.6多图联合理解能力实现开源模型SOTA ,且超越GPT-4V。 3)视频:在视频评测权威平台Video-MME ...
近日,中国人民大学高瓴人工智能学院的研究团队率先提出了「多模态角色扮演智能体」(MRPAs)的概念。这类智能体不仅能够扮演特定角色,还能够围绕图像进行多模态对话。与此同时,团队正式推出了 MMRole—— 一个专为 MRPAs ...
9月19日,2024云栖大会在杭州开幕,这是汇集AI硬科技最多的一届云栖大会,也展示了AI从科技前沿到提升生产效率、打造美好生活的应用前景。云栖大会最早可追溯至2009年,目前成为体现中国计算产业的萌发与革新的重要展会之一。
上海交大&上海AI Lab发布178页GPT-4V医疗案例测评,首次全面揭秘GPT-4V医疗领域视觉性能。 在大型基础模型的推动下,人工智能的发展近来取得了巨大 ...
金磊 明敏 发自 凹非寺 | 公众号 QbitAI 免费的AI视频通话功能,就这么水灵灵地来了。 之前B站Up主“女流姐”在直播《黑神话:悟空》的时候,科普游戏内的经文被大家津津乐道。 那么这个可以打视频通话的AI,是否也能帮玩家破译经文呢? 我们这就实测了一波: 这个AI在看完经文后,表示大致意思是: 佛陀在菩提树下教导弟子如何修行和获得无上的智慧。 而清华毕业的“女流姐”在直播中给出的解释也是 ...
过去一段时间,智谱AI持续有技术突破与商业化进展发布。据IPO早知道消息,智谱AI日前已以投前200亿估值完成新一轮融资,由中关村科学城公司领投,本轮融资资金将用于支持智谱国产基座大模型的技术创新与生态发展。这意味着,智谱AI随之成为估值真正突破20 ...
系估值规模率先超过200亿元的AI大模型企业。文丨猎云精选 ID:lieyunjingxuan作者丨王非大模型独角兽公司,新一轮融资正式落地。距2023年10月官宣年内累计融资25亿元不到一月,北京智谱华章科技有限公司(智谱AI,以下简称:智谱),被 ...
今年5月14日,OpenAI发布GPT-4o和端到端实时音视频对话模式,现场演示AI对话丝滑如人类。它能感受到你的呼吸节奏,也能用比以前更丰富的语气实时回复,甚至可以做到随时打断AI,效果非常惊艳。
根据世界卫生组织最新调查报告显示,2022年,估计有 2000 万新增癌症病例和 970 万死亡病例。癌症确诊后 5 年内存活的估计人数为 5350 万。大约五分之一的人在一生中罹患癌症,大约九分之一的男性和十二分之一的女性死于癌症。
其实早在今年年初,国内就有一家当时还名不见经传的大模型公司率先喊出 “端侧AI是未来大趋势”的口号,当时还没有太多玩家意识到端侧AI的重要性。仅仅半年后,谷歌、苹果等巨头就纷纷掉头转向,开始大模型反卷小型化,就连 OpenAI ...
近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 ...
的确,我们一直期盼GPT-5发布,整整一年多了,虽然期间OpenAI发布了GPT-4v、GPT-4o、Sora,带来一系列的震撼,但昨晚的发布不一样,是一次新的突破,计数器重置为 1,o1 应该代表着 OpenAI 下一代大模型(Orion,猎户座) ...