谷歌发布突破性的Gemini人工智能,挑战微软的OpenAI带来高级多模态能力

(SeaPRwire) – Google (NASDAQ:GOOG) (NASDAQ:GOOGL) 公布了它新的 Gemini 生成性AI模型,将自己定位为Microsoft支持的(NASDAQ: MSFT) OpenAI的GPT-4的强大竞争对手。根据DeepMind首席执行官Demis Hassabis的说法,Gemini是Google到目前为止的“最有能力和最全面”的模型。
Gemini的优势在于它是本源多媒体模型,擅长分析文本、音频、视频、图像和代码。与其他仅由不同媒体的单独模型组成的模型不同,Gemini从一开始就被设计用于集成处理所有这些媒体。
这种集成方法使Gemini更有效地理解和处理多媒体数据,从而提高它在各种应用中的性能,从解释手写笔记到分析图像和视频。
Google (NASDAQ:GOOG) (NASDAQ:GOOGL) 通过几个演示展示了Gemini的能力。其中一个强调AI能识别蓝色鸭子的绘画和实物版本。在另一个例子中,AI更喜欢有环的过山车而不是没有环的过山车,这表明它对上下文的理解。
Gemini在日常任务中也有实用应用。它可以助力教育设置,能够阅读和评估学生手写的数学答案,在需要时提供更正和解释。在代码领域,Google夸耀Gemini是领先的模型,擅长Python、Java、C++和Go等编程语言。
该公司推出了三个版本的Gemini:用于复杂数据中心任务的Gemini Ultra,中级Gemini Pro,以及用于移动设备的Gemini Nano,包括即将推出的Google Pixel 8 Pro。
Google (NASDAQ:GOOG) (NASDAQ:GOOGL) 计划将Gemini Nano集成到Pixel 8 Pro的Recorder应用的Summarize功能中,使其能够分析录音并生成概要点。此外,Gemini将驱动Gboard中的Smart Reply功能,最初支持WhatsApp,明年扩展到其他应用。
此外,Gemini Pro现在已在Google的Bard聊天机器人的英语版本中提供,提升了其在理解、总结、推理、编码和计划方面的能力。Google还宣布明年推出使用Gemini Ultra驱动的Bard Advanced。
本文由第三方内容提供商提供。SeaPRwire (https://www.seaprwire.com/)对此不作任何保证或陈述。
分类: 头条新闻,日常新闻
SeaPRwire为公司和机构提供实时新闻稿发布,覆盖超过6,500个媒体库、86,000名编辑和记者,以及90个国家350万台专业桌面电脑。SeaPRwire支持英语、韩语、日语、阿拉伯语、简体中文、繁体中文、越南语、泰语、印度尼西亚语、马来语、德语、俄语、法语、西班牙语、葡萄牙语等多种语言的新闻稿发布。