kaiyun 对话王小川：大模子创业中枢，是想好技能如何匹配产物

底稿对话CEO系列kaiyun

16min read

对话王小川：大模子创业中枢，是想好技能如何匹配产物

Moonshot宛辰2023/12/17

摘抄

AI 原生利用，必须能提供 10 倍好的体验，让用户「用得爽」。

作家 | 宛辰、Moonshot

剪辑 | 靖宇

昔日八个月，团队依托对搜索、高质地数据处理等 AI 技能累积，在模子尺寸、质地上赶快迭代。百川智能创举东谈主、CEO 王小川认为，百川应该在「联想上慢半步，落地上快三步」。

2023 年 12 月 16 日，在极客公园革新大会 2024 的现场，王小川进一步共享了大模子的新想考。

关于大模子的演进所在，王小川认为，面前大模子是「学」，关联词「不想」，接下来模子演进的所在是把「学」和「想」要合在一王人。而大模子期间作念利用，必须洽商大模子技能的秉性，这是昔日作念产物和面前最大的不同。

「昔日作念利用，老讲产物和市集之间的匹配——PMF(Product Market Fit，产物市集匹配），但产物和市集除外把一个词丢掉了，技能。」

他认为，现时的大模子技能距离 AGI 还比拟远，这种不无缺的前提下更要明确：「这样一个技能妥贴什么样的产物」，而不是产物司理知悉市集，追念就初始作念。

在王小川看来，大模子带来的新的拓荒范式下，产物司理的起点，应该从想考产物市集匹配（PMF），到想考技能与产物的匹配如何作念，即 TPF（Technology Product Fit，技能产物匹配）。

一个大模子利用，如何才算奏效，王小川认为起初是能提供比传统利用好十倍的体验，用户能「用得爽」。而要作念出这样的利用，产物司理不仅起初我方若是大模子的狂热粉丝，况且还既要有传统产物教训，又有联想力，能够想出大模子长什么样。

以下为王小川极客公园革新大会 2024 对话实录

01 大模子的「学」和「想」

张鹏：你来过咱们大会许屡次了，刚才你也很慎重地在听两位技能大师的探讨，他们谈到了前一段时候 OpenAI 事件背后有一些技能的关键身分，致使提到了大模子需要慢想考的才调，不知谈你有什么看法？

王小川：是的，本年筹办大模子到 4 月份确立公司，我提了几个关键词，一个叫搜索增强，因为要把传统学问接进去，第二个我但愿是大模子作念强化学习，那时提这个点，是因为也曾看到了大模子本人代表了一种快想考的方式，像东谈主相通，一拍脑袋我就给你谜底，张口就能说，它这种学习和利用推理的步骤是有我方的不及的，以大模子为原点确信不够，那时咱们认为强化学习可以产生很大匡助，这在百川里面干事里面，亦然一直颠倒关注的规模。

张鹏：便是慢想考？

王小川：对，便是慢想考，相干于慢想考，今天的大模子便是代表快想考。说两点我方的视力吧：快想考它都不叫「想」，慢想考的话我认为它才有这样更多「想」，以 OpenAI 大模子为代表，它叫「学」，它的学问开头是学过来的。

我并不彊调推理的「想」，其实东谈主在学习的时候，你可能就要想半天，这叫想，是以之前话孔子有一句话「学而不想则罔、想而不学则殆。」

具体投射下来，大模子便是学，它其实是不想的，它不像东谈主相通，会往来琢磨，会把联想空间开放来看，什么系统是在想？OpenAI 刚确立公司以及 DeepMind 作念的事情，比如作念 AlphaZero 和打游戏，这个事情是在想。

关联词阿谁是强化学习的确立上，叫多智能体的扞拒，AlphaZero 它不是一个学习系统，它把之前 6000 万局（棋谱磨练）的棋都扔掉了，反而是我方在扞拒博弈，在博弈中找到一种新的意会，终末通了，它是这样一个「想」。

AlphaZero 想完之后它停在原地，便是「殆」，它只作念特定的任务，无法把它拓展到其他的规模里面，因此咱们说大模子代表了「学」，AlphaZero 代表了「想」，这两个系统集在一块就会很好坏。

百川智能创举东谈主、CEO 王小川和极客公园创举东谈主兼总裁张鹏分析大模子的「学」与「想」｜极客公园

张鹏：是以接下来很迫切的是要确实作念到学而想是吧？学和想要合在一王人。

王小川：对。具体极少的话，咱们想的「想」这个场景，是你问大模子围棋如何下，它其实是不会下的。关联词你问一个围棋输了赢了能判定吗？大模子左证它已有的学问，是能够判定的。致使你说写一个代码来判定这个围棋的胜负，大模子是可以把这个代码写出来的。

你再让它写一个代码，每走一步棋之后这个棋的情景是如何调动的，也便是棋战的总共经由，它也能写出来。

是以咱们联想一下，如果大模子填塞强，天然不会径直下围棋，关联词它可以写出下围棋这样一个情景迁徙（Transaction Function）的代码，以及终末判定围棋胜负的代码。也便是说有契机让大模子我方写出一个 AlphaGo 的代码再运行它，运行完之后就可以棋战了，这件事情是有契机发生的。

张鹏：泰西的技能还在不停探索界限，也让东谈主以为有压力，你以为这个距离如何丈量，能裁汰吗？我方能创造出不同的价值吗？

王小川：去好意思国之前，我在百川这样讲的，叫「联想上慢半步，落地上快一步。」其后是去了好意思国追念之后，把联想折了半，形成「联想慢一步，落地上成快三步」。

02 大模子利用，中国可能「抢跑」

张鹏：如何意会联想上慢一步、落地上快三步？

王小川：和他们战斗之后，我认为两边想考的底层是不相通的，OpenAI 原生是一个非谋利的组织，便是想探索 AGI 的界限，况且他们果真这样作念的。

上一次跟他们聊，他们想尝试把一千万颗 GPU 连在一王人，造出填塞大的系统。一千万颗 GPU 什么见识？英伟达一年坐蓐一百万颗，GPT-4 简略是两万五千颗，咱们今天对标的 GPT-3.5 才四千颗 GPU。他们在想问题的时候，起点就跟咱们不在一个世界里面，是以跟他们拼联想，在这极少上咱们比不外。

这种情况下，东谈主和公司都要找到我方的定位，在这个泥土里，咱们要有一个自信是，咱们有契机在利用落地上走的更快。

也许随着咱们用户数据集变得更大，技能累积更淳朴之后，咱们利用能作念的填塞好，致使还能拿到好意思国去用。这种情况下，不代表说一定到了 GPT-4、GPT-5、GPT-6 的阶段，你才有契机去作念利用。

不同泥土长出不同的东西，作念利用是中国传统的一个坚忍，亦然一个革新，我反而认为是公谈了。这亦然中国公司遭受的更好的契机，尤其是如今好意思国在 OpenAI 一家独大的情况下，作念利用的公司，得迎着 OpenAI 的技能作念利用，它技能作念成什么样，你就作念什么样的利用。

关联词国内的模子公司，我方就能作念利用，这种端到端的连贯性，是有契机在利用落地时，就在一个规模里，媲好意思国的公司更快地跑出来。

王小川认为中国大模子在利用上可能跑的更快｜极客公园

张鹏：咱们有时候确信很欢快去追求一个有联想和干事感的事，在 AGI 这个大程度里，咱们可以加入这个团队，他们可能是时尚，在冲破界限，关联词咱们可能是个解放东谈主或者后腰，但他在团队里也专诚想真义，比如说我能把技能落地下来，形成有价值的东西。

王小川：这两个层面都会有推导，鹏总刚才讲的是，你手脚一个世界公民，手脚一个中国的公司，谢世界上的一个单干配合，而不是分一个敌我，只剩一种竞争的关系，他们的发明咱们尊重，咱们追逐，关联词咱们也有我方特有的孝顺。而不仅仅：我认为我需要我方，这世界并不需要我。

03 大模子创业，技能产物匹配最迫切

张鹏：蛮好的，想的很通透，在这一波创业找到了一个跟我方妥协的点，便是咱们如何谢世界性的一个专诚想真义的游戏里，成为一个玩家，有时每个东谈主都要作念时尚。

那也就说到另一个问题，今天各人都在说 Super App，都莫得看到什么是将来的 Super App，刚才李彦宏也说，今天还不成详情。但我以为如果咱们要作念 Super App，需要什么样的起点？比如说以前咱们讲 PMF（产物市集匹配），今天这个 PMF 如何作念？

王小川：对，这极少我在想可能拉近、拉远两个层面都有。拉远的原因是，当咱们遐想重构原有的利用，比如把微信再重构一次，这个想考的角度可能一下子就把我方遗弃住了，是以第一，你得把这个视角拉远。

因此回到作念 Super App，一个远期所在是它代表东谈主的根柢的诉求，这种根柢诉求，我把它总结成三个关键词，东谈主需要有三个东西：一个是我方有创造力、第二个是需要健康、第三个需要快乐。

健康快乐各人终点容易意会，关联词创造力呢，是源于东谈主谢世界里你总但愿你的存在对世界有所不同，你能对世界有所改变，因此如何能帮你去改变这个世界是一个可以平稳分出来的门类。

当咱们有这种愿景的时候，那健康如何作念、文娱如何作念，以及如何帮你获取信息，让你变的更有创造力，远期来看，这三个所在就有了。关联词反过来，咱们也会抛掉一些东西，比如说要作念营销案牍撰写，帮你作客服对话，其实大模子挺擅长作念这些，关联词我以为这些莫得回到东谈主的根柢需求，这就又陷到正本的一种所谓重构的逻辑里了。

因此有这样三个大的所在感之后，我会有不同的目的，这便是一个拉开了的想考，不然也掉到了大厂竞争的坑里去了。

第二，咱们往近拉，我想提一个迫切的词，便是刚才提到「PMF」这个词，我想用新的一个词讲，因为 PMF 老讲产物和市集之间的关系，把一个词丢掉了，便是「技能」。技能，在 AI 这个期间里，它依然有许多不无缺和不祥情味，不像以前作念淘宝或微信的时候。

我以为面前技能是瓶颈，但其实技能问题是一定可以处罚的，仅仅取决于工程师的水平、资本等等问题，你想要什么，在工程层面都能完了。但大模子技能，包括刚提到的幻觉、时效性，只会天然语言，这个技能本人就有局限性和不无缺。

是以咱们离 AGI 还有距离，正因为技能的不无缺，咱们更要明确，一个技能妥贴于什么产物，而不是先去抢市集，在市集看了一圈追念就初始作念，这种胆量我以为是挺贵重，关联词第一性旨趣「TP」技能和产物之间如何妥协，如何作念，我认为是面前要想考的事情。

举一个好的案例便是 Character.ai，Character.ai 创举东谈主其实不是产物布景，他对技能，尤其产物背后的算法是曲常地了解，他还洞见到这个技能本人是不无缺的，可能会犯错的，因此他起初意想拿它去作念文娱行业。其次，这个技能能够起初承载的是天然的对话，它是一个东谈主设，是以把它作念成一个脚色。

张鹏：这样它的错误就成了秉性？

王小川：我先提两个见识，一是，咱们以前总是以为我方在造器具，器具其实代表许多详情味，关联词咱们这一次造的不是器具，这一次咱们造的是伙伴，更像东谈主相通的新物种。咱们东谈主类要接管它我方的错误，它的优点。东谈主是有幻觉的，东谈主有幻觉我能用他，那为什么机器有幻觉就不成用呢？

终末照旧一个东谈主应当匹配一件事，是以在技能的匹配上，咱们认为得换一个视角，无须器具视角来看，而是濒临一个东谈主的视角来看，这是我的一个想路。

张鹏：你刚刚说的是 Technology - Product - Fit（技能产物契合度），TPF，而不是 PMF 这个见识。

王小川：对，对技能本人要有填塞的意会，让技能匹配相干的事情，这个对产物司理是有条目的，或者公司一号位的产物司理要产生这样的解析，大模子擅长什么，不擅长什么。这个经由是造东谈主，而不是造器具。

以前有一个讲国王与画师的故事，国王瞎了一只眼睛，缺了一条腿，关联词他很自恋，要画自画像，他就把世界的画师拉过来画，画一个杀一个，因为画得太像了，缺个眼睛，缺一条腿，那便是漫骂形象。关联词画师把眼睛画得眼力炯炯，又委宛强烈的形象，那便是欺君，相通杀掉，这问题就没解了。其后有一个画师画了国王打猎的图，站在一个大石头上，蜷着一条腿被隐讳了，国王在拉弓，缺的眼适值是闭上的，这样画就兼顾了。

技能擅长什么，不擅长什么，如何去作念匹配，这对产物司理就有更大的条目，我把它叫作念 TPF。

张鹏：TPF 这个词我以为很好。TPF 看起来才是伊始，如果站在将来，咱们要作念 Super App，如何能作念好 TPF 呢？什么情况下叫作念好了 TPF？

王小川：以前产物司理更多是写一个文档，描写对功能界说和条目，可以画结构设计图给雇主看，这个产物长这样，得志用户什么需求，精准作念到每一步的功能。

今天大模子不是这样的作念法，每次给大模子输入的时候，它的输出是不祥情的，不是用一个词一句话能讲完的。这时候很难用一套演绎规则讲了了这件事。逻辑是在作念演绎，一定要把它拆解开，形成一堆评测集，产物司理的条目不仅仅界说这个产物，而是要把界说的产物转动成背面的评测集。也便是说，要对模子在某种输入下的输出，作念什么样的测试长入。

这时，技能对口的也不是工程东谈主员，而是算法东谈主员。算法之前的工气魄俗是你给我评测集，我去优化我的算法来得志评测集。非论是通过调 prompt 的步骤、照旧作念 SFT，照旧 Post-Train 的步骤。这种情况就形成了产物司理界说评测集，技能拿到评测集之后，再去寻找数据集或者磨练集去磨练这个系统，得志这个评测集。

王小川教授如何给大模子定 OKR｜极客公园

张鹏：这便是给大模子定 OKR。

王小川：它有一套颠倒严谨的数学评价步骤。惟一干过算法的工程师都会适合这样的步骤，终末用评测集和数据讲话，在咱们里面，这形成了一种表率的干事步骤。

包括搜索公司亦然这种步骤，搜索是算法驱动型的产物，用评测集驱动的方式，仅仅咱们之前由于在互联网发展到高档阶段的时候，技能不是问题，致使也曾不是算法驱动，是工程驱动的时候，这个 PMF 不是分辩，仅仅缺了一层 TPF，终末会发现产物出来不是不成得志市集需求，而是一直在迭代，作念不出阶段性的产物。

张鹏：你刚刚某种程度解释了我很温顺的一个问题——什么是 AI-native 的拓荒。实质上，是看咱们在拓荒什么，你要在设定的盘算下设定评测集，让数据集能灵验磨练出得志评测集的条目，这个是你确实的拓荒引擎。

王小川：这是叫 AI-Native。如果 AGI-Native 的话，便是把 AI 的模子才调范式愈加深刻。

04 好的大模子利用，要让用户「用得爽」

张鹏：这如实会对产物司理提议全新的条目。以前说 PMF 作念得很可以，咱们是有感知的，比如用户的使用量增长，用户体验很好。但面前如何评价作念好了 TPF？

王小川：TPF 起初对产物司理有条目。

第一，一定能把需求转动成测试集，测试集能让技能工程师在得志需求时发现「手感」在跳跃。以及把 Demo 往外推出的时候，用户提的需求散播适值和产物司理提的评测集散播一致，评测集里面的恶果能得志用户需求。

第二，推产物的时候会提到 PMF，看市面上的 Marketing Fit（市集契合度）散播是否一致，用户是否闲逸。

张鹏：如果用户能把你拓荒的产物用得很好，是应该用得好，照旧用得爽？用得爽是用户量爆发了，形成一个 Super App；用得好是一步步来。咱们是要追求一下作念爆？照旧一层一层先处罚少数东谈主问题，再处罚多半东谈主问题？

王小川：这个不矛盾。起初「好」是跟正本对比的，你可以我方跟我方比好了若干。如果和也曾熟悉的大厂对比，好 30%、20% 便是纷乱的收益。但关于创业公司，如果是 AI-Native 原生利用的话，一初始就要用得爽，至少对一类有秉性的具体的需求，用户得以为有十倍好的感知。

张鹏：爽便是十倍好。

王小川：不是好极少，是得让你有惊喜感。今天大模子选有亮点的来作念，必须作念到十倍的体验升迁，临近的需求得作念到五倍、三倍的升迁，这样才能把波峰拔得填塞高后再迟缓拓宽。我认为这个产物如果一初始不让你爽，仅仅比正本好一些，是不够用的。

张鹏：今天在场内许多东谈主也很温顺如何参与到大模子股东的这个新期间。如果要作念新范式下的产物司理。他们应该如何开赴？

王小川：看公司属性，一种公司是要作念端到端，本人既要作念利用，也要作念模子。一种是更介意利用的公司，它不如何碰模子或者用小模子处罚。两类公司旅途上不同，但有件事情一定要先作念到，便是「用」，把我方当成大模子期间里一个狂热的粉丝，去体验和感受这个模子给你带来的不同之处，让你去敬爱它，感受它，赏玩它。今天要把这个模子用起来，就像一又友相通，你能感受什么地方行，什么地方不行。

张鹏：得先成为一个大模子的超等用户。

王小川：我信托极客公园的粉丝们天生有这样的能源，有这样的敬爱心。用起来之后，你的灵感就会冒出来，就会知谈什么是它擅长作念的事，由此再形成你背面产物的构想。

张鹏：大模子技能还在涨潮的经由中，得先随着它一王人往高涨，离它近极少才能洽商如何利用它。

公司不停在发展，你确信也在不停招东谈主。你去选产物司理的时候，会关注他什么样的气质，什么样的教训，能不成开源一下你选东谈主的表率？

王小川：百川谋略来岁发超等利用，咱们不谈教训，只可谈一些联想。

咱们蛮但愿找到之前有教训的东谈主，作念产物的东谈主你莫得之前的教训和目的，就说我想创业，这种情况下创业难度蛮高的。咱们会条目你能够把产物完整且有画面感地抛出来。能够遐想出大模子长什么样，你也有充分的推能源、敬爱心、联想力。

王小川详解 AI 期间产物司理的「既要又要」｜极客公园

同期咱们也但愿你之前有作念传统产物的教训。也便是但愿既有之前的奏效教训，关联词又能够把我方的教训打散掉去润泽大模子，还能构想出大模子新的时势，面前这个阶段，是「既要又要」。

今天中国和好意思国的环境不相通，包括百川和国内公司都是见缝插针的情景，没法给你三年、五年的时候作念探索。

05 享受大模子创业的「推背感」

张鹏：某个在相干规模有教训，但莫得技能才调，他能不成我方平稳作念大模子利用的探索？举个例子，你在健康规模里在作念致力，我在健康规模里面有多年累积的，也具备你说的气质。我是加入你的公司？照旧我方也可以在接入别东谈主的模子后作念探索？

王小川：两个谈路各人都会作念，会有东谈主我方探索，但探索经由中很有可能走着走着发现走不动了，有一种无力感，终末照旧需要模子的解救。

因此在当下中国，照旧加入一家模子公司契机更大，因为面前还没到能够独开去作念利用的程度。网上有著论述我方调模子作念利用，这个期间还莫得到来。将来两年之内，照旧加入一家公司，能够提供平台级解救，匡助你把原有教训打散掉融进来，这样奏效概率会大许多，有可能作念成超等利用。作念小利用无碍，但作念大的事情，照旧尽量和模子公司充分互动。

张鹏：听起来照旧但愿我加入百川。

王小川：主要看你但愿作念大照旧作念小。

张鹏：作念大的就得去百川。

王小川：是。

张鹏：4 月份的时候，每个东谈主恨不得晚上不寝息，面前大模子跑了 8 个月，一初始的答应也差未几消退了。创业维艰，在千里淀一段时候以后，你此次创业的心态如何样？

王小川：这 8 个月的时候团队跑得很快，成长也很赶快。面前到了更多千里淀大模子步骤论的时期，天然咱们以为我方之前的技能、才调、产物、关注、教训都填塞，但作念起来的时候依然以为不够「轻巧」。

在共同探索大模子的步骤经由中，如何找出模子和利用之间最灵验联动的情景，咱们的解析也在不停提高。我认为好的情景是：看到一个月前的我方是个痴人，那你就又跳跃了。

刚初始干事早几年的时候，是以每周的速率迭代，会发现我方的目的还不够多，此次（大模子创业）咱们又回到以月为单元，没到那么敏捷一个情景。在一个月之后看到我方之前的不及，在快速迭代中。为了参与到大模子期间，咱们的治理层和产物司理都是惊惶无措，毛骨屹然地不停调遣我方原有的干事步骤。

张鹏：这是让你很享受的情景。

王小川：对，每天都在刺激跳跃，我方还有多维地成长，哪怕目的能最初半步，但有时候发现，我方走着走着有更好的目的出来。

张鹏：挺意会这个情景。再过五年，这家公司是什么时势会让你以为比拟得志？公司的盘算是什么？

王小川：在匡助东谈主创造、健康、快乐这三个所在，咱们都有超等利用的探索。我但愿是一到五年，五年真的不敢想，因为五年之后，技能发展的高度可能都不是咱们面前能意会的，每天咱们技能东谈主员都惊叹有新的论文和发展出现，有强烈的「推背感」。

我但愿在两年时候里，咱们讲授了大模子是能够作念超等利用的，在健康、文娱、匡助东谈主创造上，它能够像互联网期间相通，给东谈主带来纷乱的匡助或者但愿，东谈主们都能够体验到或者用到，我有这样的信念。

到五年时候，咱们可能有全新的玩法，可能五年以后地上机器东谈主在跑，各人戴着 VR 眼镜，每个东谈主的数字分身都出来了。五年的时候太长，能够意想两年的画面，我就很得志了。

王小川大模子AI 原生利用