李彦宏的十条思考,解释了为什么百度能最早做出中国chatgpt-凯发k8国际首页登录
来源:四川禾嘉实业(集团)有限公司 - 凯发k8国际首页登录官网 日期:2023-03-06 09:46:05
转载于 微信公众号“王璞”
近期,百度携其大模型新项目文心一言,再次站上人工智能革命一线。三年前,“互联网 百人会”发起人张晓峰曾深度访谈百度创始人、董事长兼ceo李彦宏。张晓峰:书籍是人和外部对话的重要载体,也是很好的交互界面。相信 《智能经济》这本书对于我们和外部对话、和这个社会对话、和未来对话一定会有好处。李彦宏:是的,我们就是开放沟通,把心里想的都呈现出來。张晓峰:从您最早的超链分析专利到把更多以机器学习、深度学习、自然语言处理为核心的ai技术加载到整个搜索系统,请您再展望一下,智能搜索还会给普通用户带来哪些新体验。李彦宏:搜索本质上就是在解决人工智能最终要解决的那个问题,就是机器要真正地理解人的意图,并且能够做出相应的回应。用户表达他的需求,我们用机器试图理解人的需求,然后响应。第二代是我发明的超链分析,就是用别人的引用来证实内容的全面度和相关性;2010年前后,搜索技术完全转向了ai技术,就是用机器学习的方式:哪些用户搜哪些词,点了哪个结果,他在那个结果上停留多长时间等。完全用这些用户的行为来学习,最后回答新的用户或者新的信息方面的需求。这是一个演进的过程。百度最近十几年的研发投入,目标就是让机器智能逐步接近人的智能。在这个过程中,搜索仍然是最主要的应用方向。未来的搜索会越来越精准地理解人的意图,人的各种需求也能够更好地被表达。过去人们输入关键词搜索,现在可以用语音、图像作为输入。如果再畅想一下,未来会发生的,一个就是类似于小度音箱,更接近人的助理,而不是工具,它那种拟人化能力特征会逐步显现。以后搜索结果的呈现,除了今天的文字、图片、语音、视频等,还会有新的形式。你想知道移植白皮松的知识,也许会被导入一个植物学家的直播室,你直接提问,立刻就能得到答案。你的问题可以被一个活生生的人在直播室里解答,这是一个值得期待的场景。现在是平面、二维的表达方式,将来可能是三维立体的表达:一个虛拟人,一步一步介绍事情怎么做,让用户更容易理解。未来的搜索跟今天会很不一样,会用到很多今天还没有的技术。但它都跟al相关,都跟我们过去一二十年做的这些技术密切相关。张晓峰:如果用生态哲学的方法看待百度的生态和开放平台,您认为自己特别注重哪几个点?李彦宏:这个其实我们经过了一个比较痛苦的思考过程。在pc时代,整个互联网是完全开放的,等于我们面对的是同一个生态。那时百度只要把技术做好,外界全部内容对我们是开放的,格式是标准化的,我们做技术就好了。进入移动互联网时代之后,一个个app逐步把自己封闭起来了。这时百度面临比较艰难的选择,如果我们还走完全开放的路线,当大的app都封闭起来时,我们能获得的信息量势必会越来越少;如果我们自己也封闭起来,这跟我们的理念有冲突,而且我们需要自建一套内容体系和标准格式。经过几年的争论与探索,百度确立了长期仍然要保持开放,拥抱任何对我们开放的东西。这也跟中国现在的国家战略类似——我们坚定地相信全球化,走开放的道路,但在关键环节要开发自主可控的技术,关键的技术要掌握在自己手里。百度今天的这种理念,或者说生态基本上是基于这么一个理念实现的。张晓峰:在这个节点出现智能经济,是不是可以说算力、算法、大数据三者的发展正好在这个节点上产生了很好的吻合?就是技术的积累到这儿了,数据的积累也到这儿了,计算能力的积累也到这儿了,正好这三者在这个时点具备了爆发的能力。ai技术进一步成熟,可以运用于很多领域,大幅提升效率,并改变人们的生产生活方式。现在讲的新基建,不管是创新基础设施、信息基础设施,还是融合基础设施,其实很生动地描述了智能经济的基本特点。比如创新基础设施,我们有飞浆平台,也有语义理解技术与平台文心,后者跟谷歌bert相比,很多指标都明显高于它,效果比它好;百度的开放性与生态哲学表现在,百度有飞桨平台,谁来用都欢迎,都是免费的。apollo也是,百度有一个自动驾驶平台,源代码拿去随便用。对方跟百度是不是竞争关系,或者是不是凯发k8国际首页登录的合作伙伴没那么重要,反正大家都可以用。这样的东西,我觉得将来变成新基础设施的时候,它的迭代速度会更快。李彦宏:我们也研究了别的公司,不是每家公司都有完整、清晰定义的使命、愿景、文化、价值观等,即便一些大公司。早期,当百度以搜索为主产品形态时,提出的使命是“让人们平等便捷地获取信息、找到所求”。2017年,百度逐步进入人工智能时代,期望以自己的能力做更多的事情,使命升级为“用科技让复杂的世界更简单”。使命变得宏大,我们需要所有员工一齐朝这个方向努力,那时百度会变成一家什么样的公司?2018年暑期,我认真地思考这个问题,还是希望百度 “成为最懂用户,并能帮助人们成长的全球顶级高科技公司”。或者当遇到市场很需要,但是并不能“帮助人成长”的情况时,是不是应该放弃,如何取舍?比如搜索,我们以新愿景、使命和价值观为牵引,做广告托管页,商家介绍不再是商家想怎么说就怎么说,它要符合百度的规范,百度要对广告或者托管页上的内容负责。这是一种自我净化,即便影响广告收入,也要坚决去做,这是建立优良生态、建立信任必需的。再如小度在家,2017年就上市了。对这个设备的定义、定位是什么?很多人用小度在家学习,购买课程,获得知识;也有人用它玩游戏。这就会出现矛盾。2019年,我们确定小度在家主要是帮助孩子学习成长的设备,就逐步弱化游戏,不断强化它的教育功能,这就是根据我们的使命愿景做的取舍。每一个百度产品未来发展出现矛盾时,使命、愿景、价值观都是帮助我们做取舍的。张晓峰:我很理解也很赞同这种做法。人是一切的基础、支撑与归宿。对人的尊重、对人成长的尊重,更懂人、技术助人成长,这非常重要。人是最核心的,既是用户,又是我们的伙伴,有可能是我们生态的物种。还有可能是我们的传播者、分享者,甚至是大规模合伙制的合伙人,角色非常多元。百度从很早就选择了开放,百度生态上栖息了大量优质的生态伙伴、多样的主体和物种。我理解,别人是做“产品〞,百度是做 “社会”,这个 “社会” 将会映射每一个人、每一个ip。比如,用户数据的积累已有相当长的时间,数亿用户有很多行为数据。您刚才讲某些公司对用户数据的掌握可能也非常厉害,甚至比百度数据还要多;但是我理解,它们的理念是人和人之间的沟通,并不试图用机器理解人。百度是在真正地连接人和机器,所以我们一直在技术上不断投人,试图让机器更好地理解人。有了这些数据,相当于有了人工智能时代的燃料,我们再用技术对它进行最深刻的理解。这就是我们愿景里体现的,可以更好地连接、服务、帮助人们成长。将来产生数字孪生体,甚至“永生”,这个人也许肉体已经消失,但是他的思想、精神是永存的。他的思维逻辑、对事物的判断反应,我们都可以通过ai方式计算出来。张晓峰:未来人和场景、人和人、人和机构、人和机器、人和组织的连接,会呈指数级增长。从这个意义来看,百度更有条件、有能力做好“超级接口”,成为每一个ip的“接口人”“经纪人”,未来百度也许会成为一个人力资本银行。搜索引擎诞生之前,很难想象世界上这么广泛的知识在一秒钟之内就可以完全获得。很多以前我们需要背、需要记的东西,现在完全不需要了。再往前走,它可以回答更复杂的问题,即那种需要大量的推理、计算的问题,不是简单的一个知识点或者信息点。因此,最终百度做的不管是工具也好,助手也罢,它能够让人变得更强大,让过去要很长时间才能做到的事,现在一秒钟就能做到。让过去一个人几乎不能做的事,现在一个人完全可以做到。不仅可以对人个体赋能,而且可以对整个社会赋能,变成一个社会的基础设施。一个人不同的维度、不同的属性、不同的行为可以用数据进行标识,以知识图谱帮助学习,用ai的方法辅助成长,把握学习曲线,引导未来发展的方向和领域。当我们把技术、经济、社会、人放在大的图景里来看,不管是百度今天努力的方向,还是整个社会发展的趋势,ai理解人的技术发展,现实社会更多的人、物都数字化之后,我们就变成了一个新的社会基础设施:交通可以有交通的基础设施,医疗有医疗的基础设施,安防有安防的基础设施,应急有应急的基础设施。这些东西全部数字化,有数字孪生体,它和人之间产生各种各样的交互,就一定会大大提升社会效率,提升人们的获得感,增加整体安全性。张晓峰:未来,在新基建上,社会需要听到百度的声音,百度如何定位自身在新基建、在智能经济乃至智能社会中的角色?第一类是信息基础设施,包括人工智能、大数据、互联网等。第二类是融合基础设施,比如智能交通、智能能源网络。第三类是创新基础设施,是支撑科研、技术开发的基础设施。在融合基础设施中,能源网络我们涉及的相对少一点,但智能交通百度涉及非常深。从我们的apollo智能驾驶汽车:到后来的车路协同,到现在的智能信控——我们在长沙、保定、海淀等地部署智能控制红绿灯,协调起来帮助提升通行效率。用ai方式、数字孪生体的方式,能够让通行效率提升15%至30%,这对gdp提升也是很好的促进。对城市而言,医疗、教育、金融、交通、物流、安防、应急、综合治理等,每一个方向都可以用数字孪生体的方式大幅提升效率、降低风险、增加满意度。当社会的基础设施和人完全打通之后,会是一个完全不一样的社会,会改变我们的方方面面。再看创新基础设施,基本上和我五年前在“两会”建议上提的“中国大脑”很类似。百度有深度学习框架,完全开放开源,让别人进行创新。有自然语言理解框架,让别人不再做那些纯基础性的工作,而且这都是中国完全自主可控的基础设施。所以我们今天面临一个新的机会,就是把ai打造成社会新的基础设施。张晓峰:假以时日,百度的ai将是智能化基础设施的底座,也是智能社会的大底座。李彦宏:云确实还处在一个市场相对早期的阶段,大家的认知也不全面。对百度来说,我更希望能够利用百度ai技术上的优势,做出更加端到端的云的整合,而不是简单地在基础云这个层面拓展,跟别人进行同质化竞争。我们把它定义为智能云,我们的ai能力毋庸置疑,叫智能云合情合理。这个产业与服务必须智能化,恐怕没人会怀疑,但客户可能辦识不清。李彦宏:云其实是一个很宽的赛道,在很多领域,大家都有可发挥的空间。百度现在比较领先的技术,像智能客服就完全利用了百度在自然语言理解方面的优势。比如和联通的合作,移动电话客服无非就是套餐解释、修改服务包之类,用户需求简单,但是过去完全靠人工回答,很不经济。用百度智能客服的方式,就可以大幅提升沟通效率,而且可以给出更优的凯发k8国际首页登录的解决方案或者更准确的答案。金融服务场景,与浦发银行合作的虚拟数字人,为用户提供金融方面的咨询服务,得到了用户的认可。在医疗辅助诊疗方面,百度的技术正在很多县级医院逐步推广。张晓峰:听说您还有一个别名叫ai先生。百度在研发上投入很大,前瞻性很强。我有一个观点,所谓“战略就是站在未来看当下如何做”。请问百度当初的战略决策考量的基点是什么?内外部的质疑大不大?坚守难不难?李彦宏:确实有很大的压力,毕竟周围很多人天天盯着股票价格,会告诉你别人又做了什么特别火的产品。但是我们更愿意把这个时间轴稍微拉长一点来看技术的价值。但是你看一个30年、50年甚至更长时间的东西,你会发现坚持自己的理想还是很有价值的,最终也会有回报。1991年我到美国开始接触互联网,互联网商业化大概于1994年开始。直到2000年初,互联网高速成长。此后开始了一个相当长期的低潮。如果用纳斯达克指数来看,2000年突破了5000点,到2001年大概是1000多点。假如当时没有耐心、放弃了,后来的互联网繁荣就跟你没有什么关系了。差不多自2016年至今,是ai高速发展、被广泛认知和认可的一个阶段。过去之后,又会出现一次下滑,会有大批ai公司倒闭,因为没有快钱可赚,很多人会怀疑、会离开。但是这种基础技术的积累,随着时间的推移,它在基础设施上能够产生影响,我觉得其价值迟早会体现出来,也许五六年,也许七八年,也许十年。我正好又是一个信仰这个东西的人,所以不管面临多少压力,面临多少诱惑、多少质疑,我还是坚持自己的判断,坚持在这方面进行投入。李彦宏:也是一种自然选择。如果他们不相信这些,有很多机会到其他公司。通过这样一个自然选择,留下来一批志同道合的人,真正信仰技术可以改变世界、信仰ai是一个跟工业革命一样伟大浪潮的人,会在这儿一起做很伟大的事情。我看了一些资料,咱们整体的研发投人直稳定在15%左右?李彦宏:这些年基本上都在15%左右。有时候稍微高一点儿。但百度本身的定位就是一家高科技公司,我们应该保持这个投入。而且,确实就像您说的,很多投入是需要有耐心的,它不是两三年就能有回报的。但是如果你信这个东西,你就可以七年、十年坚持投下去。只是觉得这个技术很酷,而且我懂这门技术,它对很多人有用。那是2000年,搜索引擎还没有商业模式,大多数人也不看好它。张晓峰:有些逻辑方法是需要梳理、呈现出来,并与外部沟通。比如我们对新基建、产业智能化、智能交通方向的预判,百度的洞察,我们建构的方法论体系、我们的案例,这是值得发声和释放的。2020年4月,我们发布了专业智能交通白皮书,要用普通人能够理解的语言把它解释清楚。后来我说要有一个更视觉上的、能够跟交通联系起来的图景,用一张图解释末来的理念放在最前面。白皮书发布后总体反应确实很好,人们觉得我们的理念很超前而且有实实在在的凯发k8国际首页登录的解决方案。各个领域会逐步发布一些白皮书性质的东西,让大家理解我们心目中的智能经济、智能社会到底是什么样子时。张晓峰:其实智能交通、智能治理包括应急系统都是智慧城市的一部分。一旦数字化完成之后,该做仿真就去做仿真,该做各种各样的小流量实验就做实验。稍微调整一个参数,这个社会就会应生哪些相应的变化等。智能产业化更偏底层技术、偏基础设施,而产业智能化更偏应用。智能产业化就是怎样让这些智能技术真正变成市场所需要的东西,把它从无到有、从小到大做起来。智能产业化确实有很多新机会。比如芯片,在pc、移动互联网时代,芯片相对标淮,如cpu、gpu所用的芯片。比如智能音箱的语音识别芯片,只要能精准识别人的语音就够了,不需要其他复杂的计算,不需要那么大内存。随着应用场景的丰富,不管是语音识别专用芯片,还是图像、视频专用芯片,甚至将来自然语言理解专用芯片,都有可能出现新机会。张晓峰:我一直关注百度在整个疫情期间的举措,立体、全方位地呈现了技术的力量、责任的含义,相信这也是百度坚持do better的阶段性成果。李彦宏:百度经过这么多年的发展,无论是我们自己,还是外界,某种意义上都把百度当作一个公共设施。大家一方面很依赖,另一方面自然对百度有要求与期待。我们也一直在努力负起这种责任,满足外界对我们的期待。这次疫情,我在美国和研发中心的科学家进行交流,他们说自己的研究项目中有一个是rna二级结构预测的算法。针对国内疫情,想更快地研制出疫苗、研发出特效药,就需要更快地计算出病毒的rna结构。早一点儿把这个东西发布出来,对中国的抗疫会非常有帮助。不仅是我持这种理念,公司上下每一位员工,大家都在想百度能做什么,而没有一个人想我们能得到什么,能赚多少钱,从来没有一个人会想这种问题。张晓峰:在这次两会提案中,您专门就复工复产特别是对中小微型企业、创新企业的支持提出建议,并率先做出承诺,这些努力意义重大。李彦宏:为了恢复经济,各地方政府都在发消费券,增加人们的消费能力。其实在百度生态,我们也发了20亿元消费券,给我们的客户,给这些中小企业,让大家拿这种消费券来百度做推广、做广告,低成本地从百度平台获客,尽快恢复生意运转。李彦宏:做百度擅长的,有流量,有用户,对于帮助中小企业尽早对接消费者,我们可以有所作为。张晓峰:我有一个设想,先抛出来。未来可不可以提一句话,即让用户定义百度?这个成不成立?您认不认可?现在百度的产品经理每天做的大量工作就是分析用户行为。任何功能的改动或者升级一定要做测试,看用户喜不喜欢、接不接受。用户不接受,大概率就不做了。从公司理念的角度,我对产品经理的要求是,不仅仅要看用户即时的反应,还要看他长远行为的改变。有些产品的迭代短期内用户特别喜欢,但是长远不一定对用户有好处。比如多一些娱乐性内容,可能时长会增加,百度要求产品人员有判断,有胆量,不怕短期得罪一批用户,哪怕是顶着短期数据下滑的压力,也要有勇气按长远的。需要两三年甚至更长时间才能显现正确性的方案推进产品。我们的理念是相关性提升了之后对用户有好处,流量会增大。但是不管相关性有多么明显的提升,流量增加不会立竿见影。如果不是在理念上相信相关性提升对用户有好处,将来流量会增大,你就不敢上。但是长期,我相信用户会因为越来越好的体验,会越来越频繁地回到百度。这是一个有递延性的东西,需要有耐心、有勇气、有信仰去做这些事情。张晓峰:是,所以我们帮助人成长更多是基于人、服务人、成就人,我们从产品哲学、从产品理念到具体产品形态呈现,和他们的每一次交互,一直希望他们把时间用在有价值的地方。从另外一个角度分析,实际上我们在培植这种信任型关系。信任型关系是稀缺的,但未来完全是可以资本化的,因为有信任的红利。尤其是用户越依赖我们,我们就越有责任让用户得到真实有价值的知识信息与服务。不管是从什么渠道接触到的信息,要想判断它的真假,很多人还是会回到百度证实、证伪。这种职责,我们现在具有,更需要坚守,一定要保证百度的内容、百度的信息或者知识、服务,是大家可信赖的。张晓峰:百度的几个赛道越来越清晰了,移动生态和ai生态之间也可以打通形成相互加持,各平台之问的协同作用也越来越明显。2017年,“夯实移动基础,决胜ai时代”是一次重要的战略升级,还会有哪些重要的变化或新方向?李彦宏:夯实移动基础,决胜ai时代,这个战略没有变,但在不断进化。所谓 “夯实移动基础”,其实在2017年,我们都回答不了百度的移动基础到底是什么。随着对整个移动市场理解的深入,逐步地明确了百度的移动基础、移动生态到底包括什么,并逐步把它定义出来。即百家号、智能小程序、托管页是属于移动生态的三大支柱,很多百度产品都要围绕它们构建。外界对于百家号、小程序有比较明确的对标,可能多数人对托管页不很理解。之前搜索引擎是一个开放生态,搜索之后会跳转到第三方网站。百度审校通过了,晚上人家就改了,改成了毒网站或者乱承诺的东西。后来我们就分行业,风险最高的行业比如医疗行业,以后只要是百度的客户,绝对不允许跳转到你的网站,你只能在百度这儿发布信息。信息又要求是结构化的,比如有多少床位、多少医生,这些医生都是什么职称等,我完全能够结构化、可比较,而且不允许随便更改。后来逐步在各个行业推广托管页,这样风险就更加可控了,也让用户更加信赖我们的平台。“决胜ai时代” 就是刚刚您提到的智能交通、无人驾驶、智能生活、智能家庭等。比如我刚才讲的cdss、智能客服、智能金融、智能城市等,都在逐步形成有百度特色的凯发k8国际首页登录的解决方案。此间动态调适,不断反思,持续升华,这个过程有时候看起来简单,其实非常难。我在内部也讲,我们的肌肉记忆其实很强,你习惯了一个做事方式之后,要改是不容易的,整个改变过程确实很痛苦。但只要下定决心一步一步来,不断重复,不断强调,不断做示范,一定会有成效。张晓峰:走近百度、感知百度以后,和外部了解、认知的百度完全不一样。百度本身是一个超级ip,未来的智能时代更应该是当仁不让的领军企业,同时作为社会化的基础设施,让社会上不同的ip栖息在百度的生态上,实现它们与场景、与价值、与未来的连接和匹配。百度完全可以满怀信心而又充满坦诚地和它们交互、对话。