设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了

2023-12-17 23:27:03 来源:

  谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  科技巨头谷歌的新大模型Gemini一夜爆红,受到市场看好,但有分析指出,谷歌在Gemini的宣传资料中存在夸大宣传的嫌疑。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  当地时间12月6日,谷歌宣布推出“最大、最强、最通用”的新大型语言模型Gemini。Gemini将是首个直接在手机上运行的大模型,被应用于谷歌Pixel 8 Pro智能手机和聊天机器人Bard。Gemini被视为对于AI(人工智能)新锐巨头OpenAI旗下最新大模型GPT-4的直接回应,也象征着一度因聊天机器人ChatGPT而处于被动状态的谷歌终于正式冲回赛道。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  据谷歌介绍,Gemini在MMLU(大规模多任务语言理解)的得分率达到90.0%,是第一个在MMLU测试中超过人类专家的模型。Gemini将包括一套三种不同规模的模型,其中,Gemini Ultra被定位为GPT-4的竞争对手,Gemini Pro的性能优于GPT-3.5,Gemini Nano则用于特定任务和移动设备。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  凭借强大的性能,Gemini一夜爆红,引来了华尔街的关注。12月7日,谷歌母公司Alphabet(Nasdaq:GOOG)的股价涨5.31%,收于136.93美元,迎来自今年8月29日以来表现最好的一天,总市值达到1.72万亿美元。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  美国银行的分析师在6日指出,由于人们对于谷歌的AI能力感到担忧,Alphabet今年承受了一定的压力,而一款“具有良好品牌形象的、竞争力较强的模型”可能会吸引更多消费者使用谷歌搜索,并对云服务的销售产生积极影响:“数据显示谷歌拥有一流的、不可复制的AI能力,这可能对公司在2024年上半年的股票走势产生积极影响。”1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  摩根大通的分析师在6日的一份报告中写道,尽管市场在当天没有对Gemini给出明显的反应,能够看到谷歌在“这一主要技术转变”中的进展还是十分“鼓舞人心”。然而,摩根大通也指出,大模型在“搜索领域的货币化路径存在不确定性”,可能会在未来带来一些阻力。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  在7日的报告中,摩根大通的分析师写道:“虽然现在还处于其发展早期,但Gemini的推出象征着在生成式AI获得广泛商业化并得到广泛传播的第二年中,谷歌做出了重大创新。”1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  目前看来,谷歌如何在整体业务、尤其是最重要的搜索业务中将Gemini进行商业化是备受华尔街关注的一点。目前,谷歌计划在本月晚些时间通过谷歌云将Gemini授权给客户,并将在未来几个月与谷歌服务中的其他产品集成,但还没有公布后续的商业化策略。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  富国银行(Wells Fargo)的分析师表示,Gemini的推出应该足以平息关于“谷歌在AI领域究竟应该何去何从”的争论,不过,关键问题在于谷歌如何利用Gemini获得营利:“简而言之,我认为谷歌证明了他们仍然具有一些竞争力。”1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  而KeyBanc的分析师也表示,Gemini是谷歌今年众多AI公告的“顶峰”,但要让AI对谷歌的业绩增长和盈利能力产生积极影响需要时间:“Gemini仍在努力进入搜索等核心产品,因此我们建议耐心观察其影响。”1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  不同于华尔街的整体看好,在科技领域中有声音指出,Gemini或许存在“夸大宣传”的质疑。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  在Gemini于6日推出后不久,就有网友指出了宣传资料中的一些不妥之处。例如,当谷歌称Gemini的MMLU的得分率高于GPT-4时,显示GPT-4的得分率是86.4%,但根据谷歌发布的60页技术报告,Gemini Ultra的MMLU测试结果下有“CoT@32”的小字注释,表示其使用了思维链提示技巧,尝试了32次并从中选择最好结果。而作为对比的GPT-4却是无提示词技巧给5个示例,在这个标准下,Gemini Ultra的测试结果其实是83.7%,低于GPT-4的86.4%。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  如果是同样使用CoT@32的方法,虽然成绩仍低于Gemini Ultra,GPT-4的得分率达到了87.29%。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  如果像谷歌DeepMind首席科学家杰夫・迪恩(Jeff Dean)回应的那样,这种写法只是为了显示两种不同方法间的比较,对于Gemini测试视频的质疑则显得更加难以反驳。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  在推出Gemini后,谷歌发布了一个时长六分钟的演示视频,展现了测试员和Gemini的一些有趣互动,其中包括让Gemini识别图片并用多种语言描述、让Gemini利用一张地图设计智力问答、和Gemini玩杯子游戏和推理小游戏等等。在整个过程中,Gemini的反应速度都非常快,还会生成音频和图片来辅助回答,并用上一些口语化乃至幽默化的表达,可谓是让人大开眼界。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  然而,很快就有网友从视频开篇的文字免责声明中发现了问题,认为其可能暗示了视频中展示的是精心挑选的好结果,不是实时录制,而经过剪辑的。随后,谷歌在一篇博客文章中解释了多模态交互过程,基本上也间接承认了只有使用静态图片和多段提示词拼凑,才能达成演示视频中的效果。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  有分析指出,这和谷歌在视频中所暗示的可以说是完全不同,因为从视频看来,Gemini可以实时观察周围的世界并做出反应,用户可以与Gemini进行流畅的语音对话。沃顿商学院教授伊桑・莫利克(Ethan Mollick)也在X平台上进行了演示,如果是使用静态图片和多段提示词,完全可以通过ChatGPT Plus来复制Gemini的表现。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  在质疑发酵后,谷歌DeepMind产品副总裁伊莱・柯林斯(Eli Collins)对外媒回应称,视频中的画鸭子演示(画一个鸭子的简笔画,Gemini可以对每一步骤做出正确的解释)确实是研究级别的功能,至少目前还没有出现在谷歌的实际产品中。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  谷歌DeepMind研究和深度学习负责人副总裁奥里奥尔・维尼亚尔斯(Oriol Vinyals)也在X(原推特)平台上发布长文,解释了团队是如何制作该视频的:“视频中的所有用户提示和输出都是真实的,只是为了简洁而进行了缩短。”维尼亚尔斯还表示:“该视频展示了使用Gemini构建的多模态用户体验是什么样子。我们这样做是为了激励开发人员。”1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  然而,维尼亚尔斯的回应引发了更多的争议。有网友评论道:“如果你想激励开发者,为什么不发布真实的内容呢?被缩短的用户提示就不算‘真实’。这样做既不真诚,又具有误导性。”1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  有谷歌员工对外媒透露,他们认为这段视频描绘了一幅“不切实际的画面”。有员工表示,对这种夸张的演示并不感到惊讶,因为员工们已经习惯了公司会对产品在某种程度上进行夸大营销:“我认为大多数使用过大语言模型技术的员工都知道,要对(演示中的)这一切持保留态度。”1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  有外媒认为,谷歌“庞大的官僚体系和各级产品经理使其直到现在都无法像OpenAI那样敏捷地推出产品”。对于正在应对AI转型影响的社会而言,这并不是坏事。但对于谷歌最近这种迅速推进的表现,应该保持一定的保留态度。1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  记者 胡含嫣1Sz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了http://www.llsum.com/show-5-3916-0.html

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 加拿大对国际留学生提高生活费存款要求

下一篇: 克里米亚东部一天然气管道起火 约3万居民生活受影响

热门资讯

  • 刘德华新片撤档背后:巨亏巨冒险

      刘德华新片撤档背后:巨亏巨冒险  春节档迎来“撤档潮”。  2024年2月17日,电影《八戒之天蓬下界》发布声明退出春节档,延后上映。该片上映至今,累计票房323.2万元。  

  • 外媒:苹果因垄断将被罚逾5亿美元

      中新经纬2月19日电 据《华尔街日报》中文网19日报道,欧洲监管机构将对苹果公司(Apple Inc., AAPL)处以超过5亿美元的罚款,理由是这家科技巨头不公平的阻碍了其他音乐流媒

  • 春节假期中国快递包裹投递量日均同比增82.1%

      春节假期中国快递包裹投递量日均同比增82.1%  中新社北京2月18日电 (记者 刘育英)中国国家邮政局监测数据显示,今年春节长假期间(2月10日至17日),中国邮政快递业投递快

  • 节后成品油调价或搁浅!下一轮存上调概率

      中新经纬2月19日电 (熊思怡)19日24时,国内成品油新一轮调价窗口将开启。机构普遍预计,本次成品油零售限价调整将搁浅。  本周期横跨春节假期前后,原油市场整体偏强运行。

  • 长沙站通报“购票旅客没乘上车”:系超员,安排换乘

      中新经纬2月18日电 广铁集团长沙火车站官方微博18日称,2024年2月18日4点24分,兰州开往广州的K225次列车到达长沙站,因列车上一些旅客未在票面到达站下车,继续乘车到前方站,造

  • 春节假期中国跨区域人员流动量预计超23亿人次

      春节假期中国跨区域人员流动量预计超23亿人次  中新社北京2月17日电 (记者 刘文文)17日(正月初八)是中国龙年春节假期最后一天。来自2024年综合运输春运工作专班的最

  • 推进高水平开放 多地“新春第一会”找准这个发力点

    推进高水平对外开放是推动高质量发展、加快构建新发展格局的必然选择。在这两天各地区召开的新春第一会上,记者就发现,高水平对外开放被很多省区市都

  • 大湾区五年“马力”十足

    从广州市区驱车一个多小时,到达依山傍水的从化区。香港赛马会从化马场就坐落在从化流溪河畔的半山腰上,四周树木葱郁,山峰连绵。五年前的2月18日,《粤

  • 【你评我说·检察官看《第二十条》】书写公平正义 百姓满意可期

    检察题材电影《第二十条》春节档全国热映,艺术地诠释了“法不能向不法让步”的司法理念,受到社会各界的广泛关注。最高检微信公众号即日起开设“你评我说

  • 日本两大航司近百名员工考试作弊

      日本两大航司近百名员工考试作弊  中新网2月23日电 综合日媒报道,日本两大航空公司全日空和日本航空近日均承认,旗下子公司共有近百员工在机场驾驶资格考试中作弊。  

  • “十四五”前三年江西省单位工业增加值能耗预计下降约8%

      “十四五”前三年江西省单位工业增加值能耗预计下降约8%  中新网南昌2月22日电 (朱莹)22日,江西贯彻实施《江西省人民代表大会关于全力打造国家生态文明建设高地的决定

  • 西王集团等被执行超3.3亿

      中新经纬2月22日电 据中国执行信息公开网消息,西王集团有限公司(以下简称“西王集团”)、西王国际贸易(青岛)有限公司、王勇、王棣、王伟2月20日被青岛市中级人民法院执

推荐资讯

  • 曲江文旅2023年实现营收15.04亿元

      4月28日,曲江文旅发布了2023年财报。报告显示,曲江文旅2023年实现营业收入15.04亿元,较上年同期增幅68.80%;归属于上市公司股东的净亏损1.95亿元,较上年同期增加5262.47万元

  • 昆明今年计划建设配售型保障性住房5000套

      近日,昆明市第一批配售型保障性住房项目开工仪式举行。从仪式上获悉,2024年昆明市计划建设配售型保障性住房5000套,第一批项目共9个地块4000套,第二批申报建设1000套,已初步

  • 四川多个景区官宣免门票优惠政策

      “五一”假期即将到来。近期,四川多个景区官宣了“劳模”免票政策.    九寨沟景区  2024年5月1日至5月5日,对持有地市州及以上人民政府颁发的“劳动模范”证书、政

  • 携程推出首个“上海入境免费半日游”项目

      自4月15日起,携程推出首个“上海入境免费半日游”项目,通过向中转上海的国际旅客提供免费半日游产品,不仅提供免费交通接送及外文向导讲解,还提供外币兑换及免费上网服务等

  • 广西旅发集团20亿元私募项目状态更新为“终止”

      4月30日,据上交所债券项目信息平台显示“广西旅游发展集团有限公司2024年面向专业投资者非公开发行公司债券”项目状态更新为“终止”。该项目品种为私募,拟发行金额为20

  • 中国与格鲁吉亚互免签证协定将于5月28日生效

      近日,中国驻格鲁吉亚大使馆发布消息称,我驻格鲁吉亚大使周谦向格外交部副部长赫夫季夏什维利递交照会,确认中方已完成《中格关于互免持普通护照人员签证的协定》国内审批手

  • 阎崇年:每研究一个问题 望尽一次路

    著名历史学家阎崇年今年迎来90岁大寿。近日,他来到北京三联韬奋书店美术馆总店,同生活·读书·新知三联书店总经理宋志军畅叙“我与清史

  • 网络文学与评论有效互动,造就时代文学新景观

    网络文学正处在转型升级、迭代发展的进程中,不同类型的网络作家以不同的想象方式与叙事模式,生发网络文学的新变,在国内和海外不断拓展着网络文学影响

  • 去哪儿:五一假期酒店预订量创平台历史新高

    证券时报网消息,今年五一假期,全国旅游市场多点开花,呈现全面繁荣的态势。据去哪儿数据显示,在去年旅游需求大爆发的基础上,今年五一假期全国热门城市酒店、机票预订量仍有明显增

  • 《红楼梦》的神秘茶器

    话说《红楼梦》第四十一回,写贾母带了刘姥姥等众人至栊翠庵来,妙玉为贾母等人奉上茶后,又让宝钗和黛玉到耳房内吃“梯己茶”,宝玉悄悄地随后跟了来。有

  • 华阳山旅游发展投资有限公司与小河湾现代生态园签署全面合作框架协议

      5月6日下午,华阳山旅游发展投资有限公司与小河湾现代生态园举行全面合作框架协议签约仪式。  签约仪式上,小河湾现代生态园规划设计团队负责人详细汇报了园区规划建设情

  • 万达酒店“五一”假期下沉市场表现亮眼,特色体验带动新消费

      今年“五一”小长假,再次接棒去年“五一”,成为“史上最热门五一”假期。据文化和旅游部数据中心测算,全国国内旅游出游合计2.95亿人次,同比增长7.6%,按可比口径较2019年同期

  • 日榜
  • 周榜
  • 月榜