开yun官网入口登录APP下载 转引的知识普及帖 : 百度的文心一言究竟是什么?

作者有话要说:今天,百度的《文心易言》即将发布。人们都在问,这个《文心易言》到底是什么?作者们也在研究它。今天云开·全站APP登录入口,我就引用一篇文章,供大家学习借鉴。由于今日头条上没有原创文章,作者只能在这里抄袭,目的是为关注百度文心易言的读者科普知识。感谢文章作者和发表文章的出版社,如涉及创作权益,将立即删除。重读百度:《文心易言》是什么意思?

AI原生时代正在加速到来。

无冕之王 百度云_无冕之王百度云_无冕txt

@新熵原创

作者丨张道编辑丨一业

2022年11月30日,人工智能领域或许也会迎来与Netscape Navigator问世同样重要的关键时刻。那一天,OpenAI CEO Sam Altman发推文:“今天我们发布了ChatGPT。点击这里就可以和它聊天了。”

没想到这款应用很快就成为热议话题,据瑞银报告显示,ChatGPT上线仅两个月,月活跃用户就突破1亿,成为史上增长最快的消费应用。

随着ChatGPT的爆发式热度,其产生的巨大吞噬力量犹如黑洞,吸引了国内外各大科技、互联网公司,纷纷宣布布局ChatGPT背后的大语言模型赛道。

在外界看来,大语言模型的成熟是人工智能的一个里程碑、一个分水岭,意味着AI技术已经到达一个临界点,也预示着原有的商业模式将被重塑。由于搜索引擎行业将受大语言模型影响最大,市场已将其与百度联系起来。

作为国内搜索引擎和人工智能的代表,百度自然也不会错过这次机会。2月7日,百度确认该大型语言模型定名为“问心无愧”,英文名为“ERNIE Bot”,预计3月份完成内测并对外开放。

就在2023年2月22日,百度发布了截至2022年12月31日的第四季度及全年未经审计财务报告。2022年,百度实现营收1236.75亿元,归属于百度的净利润(非GAAP)为206.8亿元,同比增长10%。第四季度,百度实现营收330.77亿元,归属于百度的净利润(非GAAP)为53.71亿元,同比增长32%。2022财年,百度核心业绩连续四个季度超出市场预期。

借助财报数据,我们不妨尝试探寻,深耕人工智能领域数十年的百度,是否能借温心的话,完成自我转型,引发行业的“重新解读”。

搜索的代际转变

无冕之王 百度云_无冕之王百度云_无冕txt

早在ChatGPT发布的第一天,就有声音称生成式AI将取代搜索引擎。原因在于ChatGPT本质上是自然语言生成式AI,天然适合搜索场景,并提供高度智能的对话式搜索结果。

业界共识是,ChatGPT 短中期内无法完全取代传统搜索引擎,但中期内将加速搜索引擎的演进,形成以传统搜索为主、类ChatGPT模型为辅的新型搜索引擎形态,或者说生成式AI是搜索引擎的新奇点。

这和百度的想法不谋而合。

今年1月Create AI开发者大会前夕,百度搜索宣布将基于百度自研生成模型升级“生成搜索”能力,并指出生成AI与搜索引擎是互补而非替代,搜索底层技术与AI底层技术是相同的。

此前,百度董事长兼CEO李彦宏在内部直播中表示,AIGC(AI生成内容)和ChatGPT是AI技术发展到一定程度后会出现的新机会,“这个很难,但百度必须做”。

当时市场还在关注百度将如何参与这一潮流,而答案很快就揭晓——2023年2月7日,百度官方宣布即将发布一个新的大型模型项目:ERNIE Bot。

一天后,媒体披露,百度董事长兼CEO李彦宏2023年第一季度的重点OKR任务是“引领搜索体验的代际变革”。显然,温馨易言将在这一轮变革中扮演核心角色。

比如kaiyun下载app下载安装手机版,文心易言是搜索引擎从“模糊搜索”走向“精准推送”的关键:在生成式人工智能出现之前,搜索引擎主要采用“模糊搜索”,用户需要通过在搜索引擎中输入关键词来找到自己需要的内容或链接。而通过文心易言,用户可以通过自然语言交互轻松获取自己需要的内容或链接,而且内容更加精准,即“精准推送”。

同时,生成内容也会极大丰富内容生态和内容供给,让成熟的搜索业务和搜索体验焕发新生,因为一个内容产品平台是否优质,最关键的因素是内容数量、内容质量、用户互动。

从这个角度看,文心易言势必提升百度在内容层面的核心驱动力。比如,文心易言能将已有信息有效融合为语言,输出文字,人类只需扮演提供灵感的角色,AI则会在创作过程中进行辅助,生成个性化的文字内容。

对于市场关注的生成式人工智能与搜索引擎结合对商业模式带来的挑战,百度对此并不担心。

首先,百度营收更加多元化,非广告收入占比逐季提升。财报数据显示,2022年Q4,百度核心营收为257亿元,其中广告收入为181亿元,非广告收入为76亿元,同比增长11%,主要得益于百度智能云等AI驱动业务。

其次,温馨一言对广告业务来说是一大利好。道理很简单,正如一位机器学习业内人士所解释的,“从商业模式来看,广告业务最大的关键是平台的把控。平台的把控越大,粒度越细,变现空间就越大。”

可以预见,随着文心易言融入搜索,除了文心易言带来的DAU和用户使用时长提升外,搜索还能充分利用类似ChatGPT的技术进行完善升级,形成搜索的代际变革。

智能云有最新解决方案

无冕txt_无冕之王 百度云_无冕之王百度云

毫无疑问,温馨易言给搜索业务带来了改变,除了搜索之外,云计算行业也正在酝酿一场“AI浪潮”。

要了解,百度分为三条核心业务线:成熟的移动生态业务、快速发展的智能云业务、未来硬科技的智能驾驶业务,目前智能云已经成为百度的第二增长曲线。

无冕txt_无冕之王 百度云_无冕之王百度云

今年1月5日,IDC发布《2022年上半年中国AI云服务市场研究报告》。数据显示,AI公有云服务商市场格局较为稳定。2022年上半年,百度智能云依然排名第一,整体市场份额达28.1%。这也是百度智能云连续第四年位居市场份额第一。

从此角度来看,依托智能云“云智融合”的独特竞争优势,百度将帮助企业实现云与AI技术与商业实践的融合,为企业提供全场景解决方案,加速企业数字化转型和产业智能化升级的进程。

如今,在ChatGPT爆红之后,微软宣布全面推出Azure OpenAI服务,可以访问OpenAI开发的AI模型。目前已经使用过该服务的客户包括半导体电视台、毕马威、RPA厂商Moveworks等。

对于微软而言,自从2017年将战略由“移动优先、云优先”转变为“智能云、智能边缘计算”,服务于AI、云计算、数据等领域后,AI已经成为微软决胜下一个时代的重要棋子,更是此次受益于ChatGPT的前提。

百度还可以通过百度智能云向企业及机构客户提供文心易言,在同样的思路下,文心易言将成为云业务的一部分,为百度智能云赢得更多的市场空间。

正如百度集团执行副总裁、百度智能云事业群总裁沈抖所言,温馨易言是基于百度智能云技术构建的大型模型,它将从根本上改变云市场的游戏规则,云服务将从数字化时代跨越到智能化时代。

这里面其实有“隐藏收入”,考虑到国内生成式AI创业潮的兴起,算力需求会成为一大难题。对此kaiyun官方网app下载app,据投资机构A16Z最新猜测,生成式AI市场其实有大量资金流向了基础设施公司。

A16Z 估计,应用程序公司平均每年将其收入的约 20%-40% 用于推理和定制微调,这些费用通常直接支付给实例的云服务提供商或第三方模型提供商,后者将其收入的约一半投资于云基础设施。

此外,训练自己模型的初创公司已经筹集了数十亿美元的风险投资,其中大部分(早期高达80%-90%)往往花在云服务提供商身上。

基于此,可以合理推测生成式AI总营收的10%-20%将流向云服务商。而百度作为国内在AI领域最有话语权的云厂商,无疑是生成式AI创业公司的最佳选择。

总体来看,随着以大模型、AIGC为代表的AI应用成为行业热点,AI原生时代正在加速到来,而早早选择布局智能云的百度,也顺理成章地成为了国内最受益的云厂商。

温心重读百度

目前,国内多家科技公司已开启军备竞赛,一个问题随之而来:在大型语言模型的竞争中,谁能占据主动?从这个角度来看,拥有20多年发展历史、最鲜明标签始终是AI的百度无疑是“无冕之王”。

早在2010年,百度就开始探索AI技术,成为国内最早布局AI技术的巨头公司之一。近十年来,百度在AI技术研发上的投入已超过1000亿元,这几乎成为了百度近十年的主旋律。

从这份财报还可以看出,2022年百度核心研发费用高达214.16亿元,占百度核心收入的22.4%,而近十年来,百度每年的研发投入都占到营收的15%以上。

持续高强度的研发投入,让百度的AI技术各方面都处于领先地位。据《百度人工智能专利白皮书2022》显示,截至2021年底,百度全球人工智能专利申请量超过2.2万件,其中中国地区超过1.6万件,已授权专利超过4600件。

无冕txt_无冕之王百度云_无冕之王 百度云

去年12月27日,百度智能云发布了国内首个全栈自研AI基础设施“AI大基座”,全面升级25项产品和技术。简单来说,在AI原生时代,百度把芯片、大模型、深度学习框架等高门槛技术,变成了像水电一样,客户可以按需使用的技术。

聚焦大语言模型技术。人工智能的快速发展依赖于数据、算法、算力三大核心要素。在这三个方面,百度在芯片层、框架层、模型层、应用层都进行了全方位布局,拥有扎实的技术基础。

在数据层面,大型语言模型训练所采用的文本数据库主要来自互联网,而百度搜索业务在真实数据和对用户需求的理解方面积累了先发优势,这些大规模结构化和非结构化数据有望支撑《文心易言》的充分预训练。

在算力和算法方面,百度自研AI芯片昆仑可以为不同场景的AI应用提供多样化、高性能、弹性且易操作的计算服务。此外,百度拥有多个云计算可用区和大型超算集群,为大模型训练的基础设施奠定了基础。

结合对标GPT3大模型的百度文心大模型,2021年发布的“鹏程-百度文心”(ERNIE 3.0 Titan)参数规模达2600亿,是全球最大的单体中文模型。

无冕之王百度云_无冕之王 百度云_无冕txt

从这些方面来看,得益于四层技术栈,百度在国内乃至全球的大型语言模型相关技术的技术竞争中具备综合优势。

据了解,目前已有近300家互联网、媒体、金融、保险、汽车、企业软件等行业的龙头企业宣布加入百度文心易言生态,百度AIGC生态已初具规模,并即将快速扩张。

随着温馨一言的业务生态逐渐成熟,其为百度业务(搜索及云业务)带来的后续赋能,必然会让业界“重读”依靠AI信仰的百度。

关键词:

客户评论

我要评论