如何对网站进行维护,seo教育,linux配置wordpress,化妆品网页设计模板素材如今#xff0c;几乎所有中国互联网大厂都公布了自己的“类ChatGPT”解决方案#xff0c;有些还公布了背后的关于AI技术模型的详情。
其中最高调的是百度#xff0c;其“文心一言”解决方案号称即将接入数十家内容平台和数以百计的媒体、自媒体。腾讯公布的微信 AI 模型“W…如今几乎所有中国互联网大厂都公布了自己的“类ChatGPT”解决方案有些还公布了背后的关于AI技术模型的详情。
其中最高调的是百度其“文心一言”解决方案号称即将接入数十家内容平台和数以百计的媒体、自媒体。腾讯公布的微信 AI 模型“WeLM” WeChat Language Model亦受到了资本圈的广泛关注其应用重点指向文本生成和翻译。美团联合创始人、被尊称为“老王”的王慧文此前一直在寻找Web 3.0赛道的创业机会在ChatGPT火起来之后他迫不及待地宣布愿意立即带5000万美元加入AI创业由此还引发了一些人的嘲讽——5000万美元对于AI研发而言实在是太少了。
无论如何任何中国互联网公司不管是大厂、小厂还是创业公司要想在短期内缩短与ChatGPT的差距可能性几乎无限趋近于零。因为竞争对手实在太强产品进化太快了
2023年3月2日百度的文心一言和腾讯的WeLM尚未上线OpenAI实验室就正式开放了ChatGPT API应用程序编程接口每输出100万个单词的价格仅为2.7美元。
这意味着从2022年11月底ChatGPT发布开始短短三个月之内OpenAI已经将其应用成本砍掉了90%难以想象今后基于AI的应用开发会便宜到什么地步更难以想象的是中国厂商要如何缩短如此巨大的差距
中国在AI技术研发方面当然存在许多劣势中国的基础研究整体水平与美国还有很大差距高等院校、科研院所对美国顶尖研究机构的追赶才刚刚开始国内企业普遍比较年轻不像欧美大型企业那样拥有长达数十年的研发积累。
举一个最简单的例子在机器学习训练领域对GPU图形处理单元芯片的需求是非常巨大的。
据美国咨询公司TrendForce的估计要维持GPT-3.5大模型的运作至少需要2万颗GPU其中不乏英伟达出品的A100/H100高端GPU。自从ChatGPT发布以来英伟达的股价经历了几轮飙升就是因为市场意识到了机器学习是一场基于GPU供给的烧钱竞赛烧得多不一定能赢烧得少一定赢不了。
若不是部署了数以万计的A100 GPU微软Azure云拿什么去训练ChatGPT
目前在国内大部分云计算服务商无论是互联网系还是非互联网系主要使用的还是中低端GPU。
自从2022年美国颁布《2022年芯片与科学法案》就是人们常说的《芯片法案》以来国内企业进口英伟达高端GPU的难度大幅提升了。
其实就算进口高端GPU没有阻碍上万颗A100/H100级别的GPU的采购成本也是天文数字目前在国内恐怕仅有腾讯、阿里、华为、字节跳动等寥寥数家有能力承担。
何况采购不是结束而是开始由上万颗GPU组成的AI算力集群的运营成本亦是无底洞。在ChatGPT火遍全球之后微软立即向OpenAI再次注资100亿美元用于后续研发和应用——哪怕以互联网巨头的标准看100亿美元也不是一个小数目
乐观的人认为上述劣势是中国经济发展中出现的结构性问题归根结底是钱的问题。只要经济继续发展下去钱总是越来越多的。至于芯片等高端技术装备的禁运问题对于中国而言也不是什么新鲜事了在全球化的大背景下任何国家与其他国家之间都不可能做到真正的脱钩。总而言之问题是可以通过时间自然而然解决的。
然而即便我们赞成上述乐观观点总归还有一些劣势是短期内无法解决的。它们需要我们运用智慧在较长时间里慢慢解决。
过去多年英语一直是全球互联网的第一语言而中文信息的丰富程度要落后不少这就意味着用中文语料库对AI进行训练的难度要更大一些。
目前国内受过高等教育的劳动力还处于增长阶段劳动力成本可控企业对于“AI替代人工”的内生需求尚不十分强烈。
弥漫于国内科技行业包括但不限于互联网行业的急功近利的“内卷”文化限制了基础研发的空间。对于国内互联网行业在过去十几年不少公司习惯投资立竿见影的技术和应用两三年就要看到效果而要做好基础研发就必须克服这种急功近利的文化。
先说第一个问题。
虽然汉语是全世界母语人数最多的语言但是英语仍然是全世界使用面最广的语言在互联网上尤其如此。
据咨询公司W3Techs的统计显示截至2023年3月初在全球互联网的所有网站当中英文网站占比为56.6%而中文网站占比仅为1.5%。
全球互联网各语言网站占比截至2023年3月初
数据来源W3Techs
占比这么低的中文信息还被各大互联网平台“生态系统”割裂成无数碎片。
百度搜索引擎既无法覆盖淘宝商品信息也无法覆盖微信公众号微信、抖音、快手等头部App的内容基本上只能被它们内部的搜索功能触及。
中国互联网巨头若想训练自己的ChatGPT只能基于自身生态系统的数据至于那些中小型公司除非傍上巨头的大腿否则连基本的数据供给也难以保证。
当然中国厂商也可以主要使用英文信息训练自己的AI模型但这无疑将降低其在国内市场的应用潜力。
在内容质量上中文信息更难以与英文相提并论。全球顶尖的学术期刊、学术会议一般均使用英文非母语学者一般同时采用母语和英语两种工作语言这一局面在短期内不会改变。顶尖金融机构、咨询公司和智库的大部分研究报告也首发英文版本仅有少数有中文版本。
只有在研究中国特有的问题时中文资料的作用可能更大在研究其他问题时中文资料的意义就远不及英文了。
而在与艺术相关的专业领域例如美术、影视、设计、艺术史等方面法文资料的重要性超过了英文参加过国际电影节的专业人士都知道制作法文字幕和法文小册子的重要性。
无论如何中文在国际上能唱主角的领域还不多。
同时必须承认信息流媒体的算法推荐机制也拉低了中文信息的水平——大批自媒体致力于追逐短期热点通过算法获得更多流量从而加剧了信息的同质化、降低了有用信息密度。
在对AI进行训练时高度同质化的语料库效果显然比不上富有多样性和原创性的语料库效果。
从这个意义上讲中文互联网上的“震惊体”“废话体”内容比例越少对AI模型的训练就可能越有效。
有人会说“语言问题也可以随着时间得到解决。当中国足够强大之时中文信息在数量上和质量上都将获得优势没有必要杞人忧天”
这种观点与姜文在出演《星球大战外传侠盗一号》电影之后发表的论断有异曲同工之妙美国电影能够流行全球是因为美国有十多个“航空母舰战斗群”当中国也拥有这么多“航空母舰战斗群”之后中国电影就可以流行全球。
不过这个过程不是几年、十几年内能够完成的——中国厂商总不能等待中国有了十几个“航空母舰战斗群”之后再去做自己的ChatGPT吧
再说第二个问题。
技术研发归根结底是由应用需求推动的例如机器学习在互联网广告推送上的巨大作用就刺激了包括谷歌、亚马逊、字节跳动在内的一批互联网大厂研究机器学习。
以ChatGPT为代表的自然语义聊天机器人其首要应用场景还是运营和客服其次是对内容开发乃至程序开发的辅助。
在OpenAI公开ChatGPT API之后首批接入的SnapChat、Instacart、Shopify等美国互联网公司均有巨大的客服替代需求。
对于劳动力成本高的美国和欧洲企业客户而言ChatGPT可谓雪中送炭。
别误会近年来中国的劳动力成本亦呈现不断上升的趋势在局部还出现了劳动力短缺的情况。可是相对于发达国家中国的劳动力尤其是受过教育的劳动力薪酬水平还是相对较低的。对于大部分企业而言月薪几千元的电商客服、上万元的内容运营人员、一两万元的入门级码农虽然越来越难招了但总归还是能招到的。
问题来了一边是远低于欧美的用工成本一边是可能高于ChatGPT的国产AI解决方案成本企业主会如何抉择
就拿前文讨论过很多的AIGC来说假如一张二次元游戏立绘角色全身站立图的人工成本是2万元游戏公司大概很有动力用AI取代一部分画师财力比较薄弱的中小型游戏公司会更积极。
但是假如一张游戏立绘只花费 2000 元乃至1000元呢假如画师本人不是全职员工只是随时签约的外包人员不用占用游戏公司的社保成本和办公场地呢与其冒着不确定的风险去尝试AIGC大部分游戏公司还是乐意继续使用人力吧至于文字创作成本就更低了——很多几十万粉丝的自媒体大号对外征稿的报价也才一篇几百元而且可以让对方反复修改耗费的精力比调教AI还低。
附带说一句中国现阶段的“用工荒”其实主要体现为蓝领用工荒——技术工人难找训练有素的服务人员难找受过高等教育的白领却不太难找。
AI应用在早期取代的主要是中低端白领这恰好是中国劳动力过剩最明显、最不需要AI替代的领域。2022届全国大学毕业生规模达到1076万人再创历史新高加上约130万硕士、博士毕业生全国在一年之内新增的白领人才后备军高达1200万人之巨。总而言之中国的“智力资本”还处于高速扩张的状态之中这在宏观上当然是中国经济的一项重要优势但是也不可避免地压低了企业用AI替代人力的需求。
由此导致了一个“先有鸡还是先有蛋”的瓶颈因为AI解决方案相对于劳动力的成本优势不明显企业客户缺乏充分动力使用AI应用这种需求不足又会抑制AI厂商进行技术研发的积极性导致国产AI解决方案更不具备价格优势。
除非劳动力成本突然大幅上升或者有大厂愿意不计回报地砸钱否则这个恶性循环很难被打破。当然考虑到目前中国厂商对生成式AI的研发尚处于初级阶段离广泛应用还比较遥远它们现阶段或许不用太担心这个问题不过它们总有一天还是需要直面这个问题的。
接着说第三个问题。
在2021年的谷歌年报中管理层写道
“在历史上不走寻常路的精神一直驱动着我们鼓舞我们去解决重大问题投资人工智能和量子计算研究等疯狂的想法。”
乍听起来“不走寻常路”是一种很酷、很特别的精神“疯狂的想法”则是伟大公司基业长青的关键。
在于这可能意味着短期内远离主流、蒙受损失、受到外界的冷嘲热讽。一家公司若要把“不走寻常路”的精神贯彻下去至少要具备两个条件一个足够赚钱的主营业务俗称“现金牛”以及鼓励长期主义的组织文化。如果有可能还应加上第三个条件负责“疯狂的想法”的部门往往是基础研发或创新业务部门与负责赚钱的部门分开管理遵从不同的KPI并且受到同等的重视。
微软及其参与孵化的OpenAI恰恰同时符合上述三个条件第一微软的主营业务非常赚钱具备“不走寻常路”的足够本钱第二在战略性的新方向上微软一贯不吝于持续多年投入游戏及云计算业务就是典型第三OpenAI并非微软旗下的部门而是一个独立运作的公司以前曾是非营利组织所以既能享受微软的扶持又能保持创业公司的锐气。
在ChatGPT诞生之前马斯克等早期投资者也曾一度丧失信心、打退堂鼓不过OpenAI还是坚持了下来。这才是“不走寻常路”的真实含义——努力尝试不一定能成功可是只要还在尝试就有希望。
从这个角度看虽然谷歌推出的Bard AI聊天机器人早期反响不佳但谷歌确实是仅次于OpenAI的成功候选人之一。
谷歌的创始团队和现任管理层一直在用互联网广告业务的利润支持自动驾驶、医疗等新兴业务以及各个方面、各个阶段的前瞻性研究。作为由专业科研人员创立的公司谷歌一直非常重视研发部门优秀的基础研发人员受到的重视程度丝毫不亚于一线业务人员。不过在现实应用层面谷歌倒是一贯以缺乏耐心著称因为缺乏成效而迅速被它放弃或边缘化的消费级业务不在少数最近一个案例就是一度被寄予厚望的Stadia云游戏平台。
各种迹象显示谷歌做出自己的“ChatGPT”只是时间问题如果连它都做不出来那简直无法想象还有谁能做出来。
那么中国互联网公司又如何呢它们并不缺乏赚钱的主营业务但是它们所处的环境变化太快太需要“居安思危”的精神。领先者稍微停下思考一下追赶者可能就逼近到眼前了。结果就是大家都强调以快取胜先动手做起来在实践过程中慢慢形成理论。
这种高度务实的文化培养出了高度务实的管理层和业务中坚层。公允地说这是中国互联网行业的一个特点而不是缺点这在有些时候是互联网公司的加分项有些时候却是减分项。
中国互联网公司在进军海外市场尤其是发达国家市场时经常会惊叹于对方企业的效率之低下在对方还在按照流程慢悠悠地讨论问题时我们的企业可能已经把事情做完了抱着这种心态做一线业务其实是不错的可是在这种心态下培养起来的企业文化、成长起来的管理层对于负责基础研发项目恐怕就不太擅长了。超过三年以上才能看到成效的研发方向以及不知道具体怎么应用的基础技术——就算这样的项目能够被允许存在其在公司内部的优先级也不会太高。
从纸面上看国内互联网大厂都建立了独立的基础研发部门聘请知名专家乃至院士指导重要工作。在现实中此类基础研发团队由于与一线业务相隔较远其战略意义往往没有得到足够重视从企业高层获得的资源也不太稳定。
阿里于 2017 年成立的达摩院已经是其中命运较好的一个了获得了巨额预算和高度独立的组织地位在芯片、人工智能等领域也拿出过一些实用化的研究成果。然而从 2022 年开始达摩院还是被要求自负盈亏背上了短期考核压力。达摩院尚且如此其他互联网大厂的基础研发部门的处境显然不可能更好。
阿里旗下的达摩院可能是国内互联网行业内规模最大、投入最多的基础研发机构
其实如果还要继续找理由还能找出很多但是万变不离其宗在上一个时代引向成功的决定性因素在下一个时代经常会沦为拖后腿的因素。
当运动员为了新赛季努力锻炼的时候若不知道新赛季的比赛规则发生了什么根本性变化锻炼准备就有可能事倍功半。
如果没有庞大的受过高等教育的白领劳动力中国的互联网行业乃至整个科技行业不会发展得那么好如果没有以快取胜、高度务实的企业文化中国互联网大厂的成长速度不会那么快。
过去二十年互联网从业者习惯了以“高举高打”的战术去打一系列的闪电战并取得了辉煌的战果。现在要转向比拼基础研发的消耗战在转型过程中出现不适应是正常的这就是转型所必须付出的代价。
从ChatGPT诞生至今国内互联网从业者及投资人的反应看大部分人还是希望用“高举高打”的战术去解决AI研发问题的。美团联合创始人王慧文的那条朋友圈算是这种心态的一个集中体现
“组队拥抱新时代打造中国OpenAI设立北京光年之外科技有限公司我出资5000万美元估值2亿美元。我当前不懂AI技术正在努力学习所以个人肉身不占股份资金占股25%。75%的股份用于邀请顶级研发人才下轮融资已有顶级VC认购2.3亿美元各位大牛不必为资金忧心放心施展你的才华杂事交给我来打理。”
王慧文是一位非常成功的互联网企业家是美团在执行层面击败竞争对手的最大功臣之一。
在淡出美团日常管理之后他在清华大学开设的“互联网产品课”亦获得了大批专业人士的点赞。他能否在AI赛道实现二次创业成功
我不知道但有一点可以肯定“打造中国OpenAI”所需要的战略战术与打造消费互联网公司完全不同。5000万美元的启动资金、2.3亿美元的下轮融资、成功互联网企业家的加入、改变世界的豪迈气概……这些并非是在AI基础研发赛道上取得成功的充分条件甚至不一定是必要条件。
只问一个问题假如“北京光年之外科技有限公司”像OpenAI一样在成立后整整七年才拿出震惊世界的应用产品有多少人能熬过这短暂而又漫长的七年
把目光放远一些其他新兴赛道何尝没有类似的情况扎克伯格领导下的Meta因为在VR/AR技术上投入过多引发了华尔街机构的强烈不满认为Meta被华而不实的“元宇宙愿景”绑架了。
赞赏扎克伯格的元宇宙愿景认为他对VR/AR技术的应用方向有战略性误判。但是我欣赏这种乐意在一个未经验证的新兴方向上投入重兵坚信时间站在自己一边的精神。
在Meta的影响之下字节跳动于2021年收购了VR设备厂商PICO全面加入元宇宙战局。可是仅仅一年多之后PICO就开始裁员字节跳动的元宇宙野心也已意兴阑珊。与美国同行相比中国互联网公司不论在投入一项业务还是在关闭一项业务上都是效率更高的“快公司”
或许有人会说中国互联网巨头比美国同行聪明不会在一条错误的道路上走太久——问题在于谁能在半路就判断一条道路是正确还是错误的呢人类历史迄今最大的国家级研发项目是第二次世界大战期间由美国政府主导的“曼哈顿工程”。今天的人都知道这个项目成功了开启了核武器时代让美国以较小的损失赢得了对日战争。可是直到第一颗原子弹“瘦子”挂在铁塔上等待引爆时洛斯阿拉莫斯国家实验室的科学家仍然在打赌这玩意儿到底能不能爆炸要知道曼哈顿工程只持续了四年AI技术的任何一个应用方向的研发可能都要耗费更长的时间。
有人又会问既然国内互联网公司在AI赛道上存在天然劣势那么可不可以依靠中小型专精特新公司乃至创业公司去主打这条赛道呢从事实看不是已经有一批互联网大佬、互联网投资人把AI视为新的热门创业赛道了吗对于这一点我的看法相对保守原因有二。
1受到经济发展阶段和用户习惯的限制在中国做企业级To B解决方案很难赚到大钱很难称得上是一门好生意。从中国企业软件行业过去多年的成长历程就可以看出在中国只做技术解决方案、不服务消费级客户这条道路何其艰难消费互联网巨头向企业级市场扩张相对容易反过来却是难上加难。
2如果要AI公司自己去做消费级业务难度更是呈几何级数增加。中国的消费互联网市场的马太效应早已登峰造极中小平台、垂类平台的生存空间比欧美还要小。除非Web 3.0打破互联网平台的头部垄断格局否则在Web 2.0的既有格局下AI独角兽们想做大自己的消费级业务可能性几乎为零。
因此我认为即便有一天中国能产生自己的“OpenAI”它也不可能是独立产生、独立成长的甚至不太可能像美国的OpenAI那样在巨头的羽翼之下相对独立运营。
它要么直接产生于互联网巨头内部要么在做出一些成就之后被互联网巨头并入麾下。换句话说中国最前沿的AI技术研发将始终是互联网行业的一部分在互联网巨头的生态系统之内运行。下面的章节将详细解释上述判断。
跟着《大势站在十字路口的互联网行业 》一起畅想互联网乃至整个科技行业的下个时代。