面对新技术浪潮,如何找到好的产品落地方向|AI 先行者沙龙圆桌实录

2024 年 7 月 14 日,知乎科技举办「探航 · 知乎 AI 先行者沙龙」,此为圆桌对谈「面对新技术浪潮,如何找到好的产品落地方向」实录文字。主持人:刘飞 - 产品经理,「三五环」「半拿铁」主播 @刘飞嘉宾:艾逗笔 - ThinkAny 创始人,独立全栈开发者 @艾逗笔陈亮 - 金山办公高级技术总监卢炜英 - 美图公司高级产品总监延君晨 - Dify.AI 联合创始人嘉宾对谈刘飞:大家好,我是刘飞,之前一直做产品经理,也一直在关注AI领域,有两档播客,一档是主要关注互联网和科技的“三五环”,还有一档是关注商业故事的“半拿铁”,接下来有请各位对谈的嘉宾分别介绍一下自己以及在做什么样的产品。先有情艾逗笔。 艾逗笔:大家好,艾逗笔是我的网名,我在十多年前在大学的时候有一个Adobe的软件公司,我受到它的影响进入IT行业,为了致敬当初就起了艾逗笔这么一个同音不同词的网名,一直用到现在。我在2018年加入腾讯,在深圳待了7年的时间,上一份工作是在腾讯的微信部门,去年10月份从微信辞职出来,我现在的状态就是一个自由职业者,一直在做独立开发,今年3月份我做了一个AI搜索的产品叫做ThinkAny,主要是面向海外市场,今天也是很荣幸被邀请来知乎的这个场子跟各位大佬一起对谈。 陈亮:各位嘉宾下午好,我是金山办公的陈亮,现在在金山负责B端AI的研发。打一个小广告,金山办公在4月份发布了今年的B端战略产品,包括AI Hub、AI Dos、AI copilot这三个产品方向。今年7月份的WAIC上海人工智能大会也展出了最新的技术成果。今天受到知乎的邀请,很荣幸,也很感谢,我也会和大家分享一下我们的AI进展。 卢炜英:大家下午好!我是来自美图的卢炜英,大家应该都用过美图秀秀、美颜相机,我们团队去年开始在做一款产品叫做开拍,它是一款用AI帮助用户制作口播视频的AI应用,从前期的内容策划到中期的拍摄、后期的剪辑,帮助原本没有视频基础的普通人也能做出一个高质量的口播视频,上线了一年左右,用户和收入趋势都还不错。 延君晨:我叫延君晨,来自Dify.AI。我互动一下,我不知道在座的有多少工程师,或者有多少人以前用过Dify来做自己的项目。(少数听众举手),今天可以打广告了,Dify.AI目前还是比较主流的一个大模型应用开发框架,目前在GitHub上有大概3.7万左右的Star,这个量是全球第二的,仅次于LangChain。过去一年我们也陆续发布了很多能力,大家可以在会后去我们的开源社区下载体验。我们也运行了一个海外的SaaS服务,和ThinkAny一样,业务主要是在全球市场。 刘飞:OK,感谢各位。我们今天这个圆桌的主题是什么呢,还是关于面对现在AI其实从去年ChatGPT3.5出来之后,大家知道这两年互联网圈都在讨论这个。面临这样的一个浪潮,大家都在谈论产品。在做的有多少产品经理?并不多,是不是都是做技术出身的,我们今天聊的“面对新技术浪潮,如何找到好的产品落地方向”,希望能给大家一些启发,也希望大家能从当中找到一些场景。既然说到产品落地,今天的主办方又是知乎,我们就先聊聊知乎最近落地的一个产品,知乎最近有一个新的AI产品叫做“直答”,今天直答的产品负责人Kevin也在现场。台上几位嘉宾应该都使用过,对它有什么感受,以及有什么建议? 艾逗笔:直答我也用过一阵子,我对这类产品是非常熟悉的,因为我现在在做的也是AI搜索引擎。我觉得直答最大的优势是基于知乎的优质内容源推出的垂直搜索产品,它最大的优势是我问某些具体一点的问题,它给我的回答质量是非常高的,比我用海外的 perperlaxity、秘塔、或者是360搜索的答案质量更高。底层原因是它有一份非常优质的信息源,所以我对这类产品的看法是,它是基于本身的优质内容推出的垂直类的搜索类产品,它有自己非常独特的优势,对于这类产品,不管是小红书做的垂直搜索,还是之前腾讯元宝基于公众号的信息源做的垂直搜索,这类产品最大的特点就是它自己依赖于十多年的发展,有了一份非常大的壁垒,这个壁垒叫做数据,所以我觉得AI搜索的一个很关键的问题还是在于数据壁垒,所以我是非常看好知乎直答的,也期待它后续有更多新的功能推出。 陈亮:其实我也是知乎的老粉丝,每天都会刷知乎,直答我也用过一段时间,它给我的最大感触是说,它本质上是基于站内+站外双重检索的AI搜索,就像艾逗笔说的,它在站内有非常优质的内容,这就可以类比到金山办公在做的一款智能问答产品,它本质上是基于库的内容,或者已有的私域知识来做检索增强技术的结合。基于这个观点,对于后续我的浅显看法是,要把更多优质的内容打穿、做透。因为AI搜索在站外和站内,有UGC的内容及也有PUGC,在知乎里面有博主、UP主点赞,有反馈,这一块可以做沉降,Top的就是比较优质的,有可信度的,AI搜索最在意的就是准确度,既然是准确的,就应该把它更多的秀出来,比起站外搜索,它在可信度和准确度方面会有更大的优势。我们现在看到这个问答右侧的站外结果有20条,有12条是站内的,8条是站外的,不知道这样的设计初衷是什么,它可以有一个比较好的溯源,就是可以看到这个答案的出处在哪里,这也是可以在产品中给用户增加一定的信心,告诉大家这个答案不是乱说的。总结来说,我建议知乎在自身的优质内容的基础上往AI搜索方向发展,这会是一个比较大的亮点。 卢炜英:我用直答也有一段时间了,就像前面各位嘉宾说的,它的训练数据是比较优质的,所以它的质量比市面上很多大语言模型的质量更好。但是我觉得更重要的优势或者比较稀缺的资源是它给用户的信任感或者信赖感。我用了很多不同的大语言模型,有时候还是会有一本正经胡说八道的情况出现,知乎的直答的质量会更高一点,对它的信赖和信任感会更强一点,这也是直答跟市面上同类产品竞争的一个比较好的抓手或者机会点。 刘飞:前面大家都说的是优势,延君晨能不能吐槽一下,说说这个产品现在还有哪些问题,或者说还有哪些潜力? 延君晨:其实我也是准备吐槽的。因为利益攸关,我是知乎的迷你小股东,亏了很多钱。海外这一波流量起来的公司商业化做得都不错,国内因为大厂很卷,确实商业化很难,可不可以想到一个更好的路径赚钱,可能是所有AI产品现在很重要的一点。我始终觉得AI搜索是一个很好 rag 的场景,无论是ThinkAny,还有国内的很多大厂都在做,这又回到应用产品的死局,大家都很封闭,基本上都是在自己的生态内做事情。有没有可能知乎的产品能把自己的API封装出来,给包括Dify,包括Coze这样的Agent平台,或者是给手机厂商提供原子化的能力,变成一个应用调用的工具,把这个能力封装出去,也可能会把这个市场空间想象力打开得更多,以及有更多的开发者会去用这个产品。 陈亮:做开源是吧? 延君晨:不是开源,是生态思路,让别人能调用这个工具,而不是自己封装成一个产品。刚刚OPPO在讲的时候,观点跟我们的观点是一样的,未来很有可能用户跟原子能力之间的交互可能是通过某个硬件,但是这个硬件背后也是一个模型、一个AI产品,可能原来那些可视化应用的交互会被解耦掉,再花精力做一个关注于体验的应用可能没有那么大的价值,如何把这个原子化的能力链接到所有生态网络中,可能是更有想象力的。 陈亮:我接着君晨的观点讲讲,我觉得Open API这个事情在AI时代是非常重要的,包括艾逗笔也好,我们金山办公在内,很多时候也面临客户说,能不能拿点我的能力来构建一个应用,这是一个很朴素的需求,所以我们也有这方面的计划,也已经推出一定的成果。另外回到直答这个场景,我个人是浏览为主,二八定律,我是80%,消费的。直达是面向生产或者提问的用户,我不知道直答在模式的改变,在用户层面,它的接受程度或者担忧是什么样的,会不会说我有了锤子,但是那个钉子不存在,我是有这样一个疑问。 刘飞:既然说道锤子和钉子的问题,我们就沿着这个话题往下说。现在行业里确实大家有一种感觉,技术每天在日新月异,各种各样的新技术,开源的、闭源的,参数也越来越大,芯片卖得越来越贵,但是真正大家在日常高频使用的场景好像并没有想象的那么多,大家日常打开的那些产品数量可能相对有限。是不是现在在很多创业的朋友,或者说你们在做很多事情的时候会发现有拿着锤子找钉子的现象?还是说你们很有信心,其实现在已经存在很多值得落地的场景,只是大家还在路上? 陈亮:这个问题我是这么看的,我们先定义清楚什么是锤子,什么是钉子,然后再去讨论这个问题。在我的看法里面,金山办公做的WPS AI,它的锤子就是我们基于大模型来生产出一定的办公场景提效的工具,包括问答、创作、图谱类的应用和摘要。钉子是用户的需求,到底我们做出来的东西是不是用户想要的,有没有能跟用户的场景做一定的匹配,这是我们要思考的问题。 我个人的观点认为,不是行业都在拿着锤子找钉子,我觉得更靠谱的做法是,先找出钉子到底在哪里,客户的需求到底是什么,然后根据这个来改造我们的锤子,或者说重新设计我们的锤子。举个比较典型的例子,就是我们在跟客户共创的过程中,我们一开始对用户到底需要什么样的AI平台或者产品并不太了解,随着我们跟用户沟通的深入,就会发现在企业这个场景里面,包括我们的创作,用户会有各种各样的写报告、写公文的场景,我们就知道AI是在他的火力范围之内,这个事情是我们可以帮客户做好的事情,然后我们才去改造或者打造锤子。而不是说我们用AI功能做了一个写作功能,但是用户拿来不知道怎么用,或者是没有用处。我觉得是一个平衡的过程,双向都有,一开始先有这个工具出来,能不能找到钉子不好说,怎么解决这个问题,就需要从客户中来,再到客户中去,我觉得是两方面结合的方式。 刘飞:我觉得在座的几位嘉宾里,可能卢炜英离用户或场景是最近的,因为美图哪怕不是这两年AI浪潮之前,很多AI算法已经在用了,以前有AI美颜,现在有AI消除,我用了AI消除之后,发现要充会员才能导出,所以你们的商业化已经是比较成熟的,你是怎么看待锤子和钉子这件事? 卢炜英:我觉得去年这个问题会比较突出一点,因为去年AI大爆发,大家也是在抢时间窗口,所以会做很多不同的尝试,今年感觉到无论是行业还是公司都会更冷静一点,就像今天的主题一样,都在讨论AI如何落地、如何赚钱。我感觉这是事物发展的正常现象,智能手机刚出来的时候,也有非常多喝啤酒、打火机、汤姆猫这种,可能是偏玩的,或者是一波流的应用,这也是一个新事物,大家去尝试,去试探技术边界的必经过程,所以我感觉这个问题不大。 刘飞:你们在公司内是怎么看待该怎么找场景的问题,怎么确定这是一个你们值得做的场景? 卢炜英:我们有非常多方法。本质上来说我们就是一个应用公司,AI技术我们也研究了很久了,影像实验室设立的十几年,影像这一块我们也是国内头部的。如果我们发现一个新的技术,或者一个新的现象出现的时候,我们更多从用户角度出发,判断一个宏观的环境、行业的情况下有没有竞争的机会点,如果有机会之后,再去看用户需求方面,它的用户价值,如果价值够大的话,我们就会用这个技术去切这个市场。 刘飞:君晨,你们面向的用户是相对特殊一点的,不是纯C端的,主要B端或者小开发者。 延君晨:我们的用户都在找钉子。 刘飞:你是怎么看待这件事的? 延君晨:我们的用户大B比较多,这跟我们的初衷不一样,大家都以为我们是做SMB的,我们也以为我们是做SMB的,后来发现我们是做KA的,给钱的是KA客户。这是比较好玩的,我跟大家一样,去年大家都是有了一个锤子,开始找钉子,今年所有人都反过来了。比如说这里面用亚马逊的逆向工作法的思路考虑问题比较好,所有的企业基本上都是先从现在的场景和问题出发,反过来非常现实的,非常功利主义的去找模型。据我所知金山应该接了所有的模型,可以随便换,所以今年大模型公司就收不到你们的钱了。我们接触的客户,以中国来说,现在愿意给大模型付钱的客户很少,原因是话语权不一样,真正有场景的,就是所谓的钉子在客户那边。然后技术方面,尤其是大模型技术没有大家想的那么不易得,因为现在开源模型技术做得很好,据我了解国内通义、零一万物这些开源可商用的模型渗透率已经很高了。回答你刚才的问题,现在AI行业已经确定不是在用锤子找钉子,是基于钉

Jul 16, 2024 - 22:00
 0  6
面对新技术浪潮,如何找到好的产品落地方向|AI 先行者沙龙圆桌实录

2024 年 7 月 14 日,知乎科技举办「探航 · 知乎 AI 先行者沙龙」,此为圆桌对谈「面对新技术浪潮,如何找到好的产品落地方向」实录文字。

主持人:刘飞 - 产品经理,「三五环」「半拿铁」主播 @刘飞

嘉宾:

  • 艾逗笔 - ThinkAny 创始人,独立全栈开发者 @艾逗笔
  • 陈亮 - 金山办公高级技术总监
  • 卢炜英 - 美图公司高级产品总监
  • 延君晨 - Dify.AI 联合创始人

嘉宾对谈

刘飞:大家好,我是刘飞,之前一直做产品经理,也一直在关注AI领域,有两档播客,一档是主要关注互联网和科技的“三五环”,还有一档是关注商业故事的“半拿铁”,接下来有请各位对谈的嘉宾分别介绍一下自己以及在做什么样的产品。先有情艾逗笔。

艾逗笔:大家好,艾逗笔是我的网名,我在十多年前在大学的时候有一个Adobe的软件公司,我受到它的影响进入IT行业,为了致敬当初就起了艾逗笔这么一个同音不同词的网名,一直用到现在。我在2018年加入腾讯,在深圳待了7年的时间,上一份工作是在腾讯的微信部门,去年10月份从微信辞职出来,我现在的状态就是一个自由职业者,一直在做独立开发,今年3月份我做了一个AI搜索的产品叫做ThinkAny,主要是面向海外市场,今天也是很荣幸被邀请来知乎的这个场子跟各位大佬一起对谈。

陈亮:各位嘉宾下午好,我是金山办公的陈亮,现在在金山负责B端AI的研发。打一个小广告,金山办公在4月份发布了今年的B端战略产品,包括AI Hub、AI Dos、AI copilot这三个产品方向。今年7月份的WAIC上海人工智能大会也展出了最新的技术成果。今天受到知乎的邀请,很荣幸,也很感谢,我也会和大家分享一下我们的AI进展。

卢炜英:大家下午好!我是来自美图的卢炜英,大家应该都用过美图秀秀、美颜相机,我们团队去年开始在做一款产品叫做开拍,它是一款用AI帮助用户制作口播视频的AI应用,从前期的内容策划到中期的拍摄、后期的剪辑,帮助原本没有视频基础的普通人也能做出一个高质量的口播视频,上线了一年左右,用户和收入趋势都还不错。

延君晨:我叫延君晨,来自Dify.AI。我互动一下,我不知道在座的有多少工程师,或者有多少人以前用过Dify来做自己的项目。(少数听众举手),今天可以打广告了,Dify.AI目前还是比较主流的一个大模型应用开发框架,目前在GitHub上有大概3.7万左右的Star,这个量是全球第二的,仅次于LangChain。过去一年我们也陆续发布了很多能力,大家可以在会后去我们的开源社区下载体验。我们也运行了一个海外的SaaS服务,和ThinkAny一样,业务主要是在全球市场。

刘飞:OK,感谢各位。我们今天这个圆桌的主题是什么呢,还是关于面对现在AI其实从去年ChatGPT3.5出来之后,大家知道这两年互联网圈都在讨论这个。面临这样的一个浪潮,大家都在谈论产品。在做的有多少产品经理?并不多,是不是都是做技术出身的,我们今天聊的“面对新技术浪潮,如何找到好的产品落地方向”,希望能给大家一些启发,也希望大家能从当中找到一些场景。

既然说到产品落地,今天的主办方又是知乎,我们就先聊聊知乎最近落地的一个产品,知乎最近有一个新的AI产品叫做“直答”,今天直答的产品负责人Kevin也在现场。台上几位嘉宾应该都使用过,对它有什么感受,以及有什么建议?

艾逗笔:直答我也用过一阵子,我对这类产品是非常熟悉的,因为我现在在做的也是AI搜索引擎。我觉得直答最大的优势是基于知乎的优质内容源推出的垂直搜索产品,它最大的优势是我问某些具体一点的问题,它给我的回答质量是非常高的,比我用海外的 perperlaxity、秘塔、或者是360搜索的答案质量更高。底层原因是它有一份非常优质的信息源,所以我对这类产品的看法是,它是基于本身的优质内容推出的垂直类的搜索类产品,它有自己非常独特的优势,对于这类产品,不管是小红书做的垂直搜索,还是之前腾讯元宝基于公众号的信息源做的垂直搜索,这类产品最大的特点就是它自己依赖于十多年的发展,有了一份非常大的壁垒,这个壁垒叫做数据,所以我觉得AI搜索的一个很关键的问题还是在于数据壁垒,所以我是非常看好知乎直答的,也期待它后续有更多新的功能推出。

陈亮:其实我也是知乎的老粉丝,每天都会刷知乎,直答我也用过一段时间,它给我的最大感触是说,它本质上是基于站内+站外双重检索的AI搜索,就像艾逗笔说的,它在站内有非常优质的内容,这就可以类比到金山办公在做的一款智能问答产品,它本质上是基于库的内容,或者已有的私域知识来做检索增强技术的结合。基于这个观点,对于后续我的浅显看法是,要把更多优质的内容打穿、做透。因为AI搜索在站外和站内,有UGC的内容及也有PUGC,在知乎里面有博主、UP主点赞,有反馈,这一块可以做沉降,Top的就是比较优质的,有可信度的,AI搜索最在意的就是准确度,既然是准确的,就应该把它更多的秀出来,比起站外搜索,它在可信度和准确度方面会有更大的优势。

我们现在看到这个问答右侧的站外结果有20条,有12条是站内的,8条是站外的,不知道这样的设计初衷是什么,它可以有一个比较好的溯源,就是可以看到这个答案的出处在哪里,这也是可以在产品中给用户增加一定的信心,告诉大家这个答案不是乱说的。

总结来说,我建议知乎在自身的优质内容的基础上往AI搜索方向发展,这会是一个比较大的亮点。

卢炜英:我用直答也有一段时间了,就像前面各位嘉宾说的,它的训练数据是比较优质的,所以它的质量比市面上很多大语言模型的质量更好。但是我觉得更重要的优势或者比较稀缺的资源是它给用户的信任感或者信赖感。我用了很多不同的大语言模型,有时候还是会有一本正经胡说八道的情况出现,知乎的直答的质量会更高一点,对它的信赖和信任感会更强一点,这也是直答跟市面上同类产品竞争的一个比较好的抓手或者机会点。

刘飞:前面大家都说的是优势,延君晨能不能吐槽一下,说说这个产品现在还有哪些问题,或者说还有哪些潜力?

延君晨:其实我也是准备吐槽的。因为利益攸关,我是知乎的迷你小股东,亏了很多钱。海外这一波流量起来的公司商业化做得都不错,国内因为大厂很卷,确实商业化很难,可不可以想到一个更好的路径赚钱,可能是所有AI产品现在很重要的一点。我始终觉得AI搜索是一个很好 rag 的场景,无论是ThinkAny,还有国内的很多大厂都在做,这又回到应用产品的死局,大家都很封闭,基本上都是在自己的生态内做事情。有没有可能知乎的产品能把自己的API封装出来,给包括Dify,包括Coze这样的Agent平台,或者是给手机厂商提供原子化的能力,变成一个应用调用的工具,把这个能力封装出去,也可能会把这个市场空间想象力打开得更多,以及有更多的开发者会去用这个产品。

陈亮:做开源是吧?

延君晨:不是开源,是生态思路,让别人能调用这个工具,而不是自己封装成一个产品。刚刚OPPO在讲的时候,观点跟我们的观点是一样的,未来很有可能用户跟原子能力之间的交互可能是通过某个硬件,但是这个硬件背后也是一个模型、一个AI产品,可能原来那些可视化应用的交互会被解耦掉,再花精力做一个关注于体验的应用可能没有那么大的价值,如何把这个原子化的能力链接到所有生态网络中,可能是更有想象力的。

陈亮:我接着君晨的观点讲讲,我觉得Open API这个事情在AI时代是非常重要的,包括艾逗笔也好,我们金山办公在内,很多时候也面临客户说,能不能拿点我的能力来构建一个应用,这是一个很朴素的需求,所以我们也有这方面的计划,也已经推出一定的成果。另外回到直答这个场景,我个人是浏览为主,二八定律,我是80%,消费的。直达是面向生产或者提问的用户,我不知道直答在模式的改变,在用户层面,它的接受程度或者担忧是什么样的,会不会说我有了锤子,但是那个钉子不存在,我是有这样一个疑问。

刘飞:既然说道锤子和钉子的问题,我们就沿着这个话题往下说。现在行业里确实大家有一种感觉,技术每天在日新月异,各种各样的新技术,开源的、闭源的,参数也越来越大,芯片卖得越来越贵,但是真正大家在日常高频使用的场景好像并没有想象的那么多,大家日常打开的那些产品数量可能相对有限。是不是现在在很多创业的朋友,或者说你们在做很多事情的时候会发现有拿着锤子找钉子的现象?还是说你们很有信心,其实现在已经存在很多值得落地的场景,只是大家还在路上?

陈亮:这个问题我是这么看的,我们先定义清楚什么是锤子,什么是钉子,然后再去讨论这个问题。在我的看法里面,金山办公做的WPS AI,它的锤子就是我们基于大模型来生产出一定的办公场景提效的工具,包括问答、创作、图谱类的应用和摘要。钉子是用户的需求,到底我们做出来的东西是不是用户想要的,有没有能跟用户的场景做一定的匹配,这是我们要思考的问题。

我个人的观点认为,不是行业都在拿着锤子找钉子,我觉得更靠谱的做法是,先找出钉子到底在哪里,客户的需求到底是什么,然后根据这个来改造我们的锤子,或者说重新设计我们的锤子。举个比较典型的例子,就是我们在跟客户共创的过程中,我们一开始对用户到底需要什么样的AI平台或者产品并不太了解,随着我们跟用户沟通的深入,就会发现在企业这个场景里面,包括我们的创作,用户会有各种各样的写报告、写公文的场景,我们就知道AI是在他的火力范围之内,这个事情是我们可以帮客户做好的事情,然后我们才去改造或者打造锤子。而不是说我们用AI功能做了一个写作功能,但是用户拿来不知道怎么用,或者是没有用处。我觉得是一个平衡的过程,双向都有,一开始先有这个工具出来,能不能找到钉子不好说,怎么解决这个问题,就需要从客户中来,再到客户中去,我觉得是两方面结合的方式。

刘飞:我觉得在座的几位嘉宾里,可能卢炜英离用户或场景是最近的,因为美图哪怕不是这两年AI浪潮之前,很多AI算法已经在用了,以前有AI美颜,现在有AI消除,我用了AI消除之后,发现要充会员才能导出,所以你们的商业化已经是比较成熟的,你是怎么看待锤子和钉子这件事?

卢炜英:我觉得去年这个问题会比较突出一点,因为去年AI大爆发,大家也是在抢时间窗口,所以会做很多不同的尝试,今年感觉到无论是行业还是公司都会更冷静一点,就像今天的主题一样,都在讨论AI如何落地、如何赚钱。我感觉这是事物发展的正常现象,智能手机刚出来的时候,也有非常多喝啤酒、打火机、汤姆猫这种,可能是偏玩的,或者是一波流的应用,这也是一个新事物,大家去尝试,去试探技术边界的必经过程,所以我感觉这个问题不大。

刘飞:你们在公司内是怎么看待该怎么找场景的问题,怎么确定这是一个你们值得做的场景?

卢炜英:我们有非常多方法。本质上来说我们就是一个应用公司,AI技术我们也研究了很久了,影像实验室设立的十几年,影像这一块我们也是国内头部的。如果我们发现一个新的技术,或者一个新的现象出现的时候,我们更多从用户角度出发,判断一个宏观的环境、行业的情况下有没有竞争的机会点,如果有机会之后,再去看用户需求方面,它的用户价值,如果价值够大的话,我们就会用这个技术去切这个市场。

刘飞:君晨,你们面向的用户是相对特殊一点的,不是纯C端的,主要B端或者小开发者。

延君晨:我们的用户都在找钉子。

刘飞:你是怎么看待这件事的?

延君晨:我们的用户大B比较多,这跟我们的初衷不一样,大家都以为我们是做SMB的,我们也以为我们是做SMB的,后来发现我们是做KA的,给钱的是KA客户。这是比较好玩的,我跟大家一样,去年大家都是有了一个锤子,开始找钉子,今年所有人都反过来了。比如说这里面用亚马逊的逆向工作法的思路考虑问题比较好,所有的企业基本上都是先从现在的场景和问题出发,反过来非常现实的,非常功利主义的去找模型。据我所知金山应该接了所有的模型,可以随便换,所以今年大模型公司就收不到你们的钱了。我们接触的客户,以中国来说,现在愿意给大模型付钱的客户很少,原因是话语权不一样,真正有场景的,就是所谓的钉子在客户那边。然后技术方面,尤其是大模型技术没有大家想的那么不易得,因为现在开源模型技术做得很好,据我了解国内通义、零一万物这些开源可商用的模型渗透率已经很高了。

回答你刚才的问题,现在AI行业已经确定不是在用锤子找钉子,是基于钉子组装你的工具,所以这也是为什么今年大家看到涌现出了很多类似于Dify、扣子、元器,百炼等产品,因为这些产品存在的目的就是为了让大家把钉子问题解决好。

刘飞:艾逗笔因为是独立开发者,所以你是独立在面向这个事情,你之前也做过好多产品,你是怎么看待钉子的问题?怎么选择产品方向的?

艾逗笔:我觉得锤子和钉子是不同人从自身的需求出发,或者自身角色出发,有不同的看法。为什么有人要看钉子呢?因为他是产品经理或者是做商业化的,他更关心的是如何更贴切满足用户的需求,确认这个需求是存在的,他再来满足这个需求,打造一把好用的锤子,这是从产品经理或者商业化的角度出发的。但是做锤子的人的初衷,他可能更多是从战略的角度出发,比如说现在的这些大模型的公司,它就觉得AI时代未来的大部分应用都是基于AI来做的,也就是AI会慢慢成为一个底层的基础设施、基础能力。如果说我们未来钉子蓬勃发展,你自己没有一把好用的锤子,你要拿别人的锤子来打钉子,就是很不靠谱的。所以月之暗面这种大模型公司选择做大模型,它首先觉得要把大模型的长度搞得特别长,因为它觉得未来的信息量是非常大的,我必须要在别人的模型都在卷智能或者卷其它方向的时候,我先把这个长度搞得特别长。基于长度特别长的模型,就会找到需要用到长文本的场景,比如AI搜索,我要挂载很多信息,如果只做暴力传输,肯定对模型上下文的长度要求是非常高的,从这个角度,他肯定优先关注自己模型的能力。另外比如说OPPO或者其它做AI PC的厂家,因为自己有做锤子的能力,又预感到钉子会蓬勃发展,肯定是优先把生态做好,就像OPPO的老师讲到的,把各种能力做成原子化,只要锤子做得足够好,任何人都可以拿我的锤子敲你的钉子。所以我觉得这两个方向没有绝对的正确与错误,就看不同的人基于自身的决策可能有不同的考量。

刘飞:顺着这个问题聊一聊,刚才君晨也说了,现在各个公司尤其是大厂都有自己的大模型,都有自己的技术,包括开源和闭源的,都有很多工具应用。你自己独立开发者,你觉得现在的技术够用还是不够用,还是说现在更多的是缺场景?

艾逗笔:我觉得都缺。比如说现在模型不断地迭代,不断有更好的模型出来,现在最大的问题就是如何找到一个能够让用户有更高黏性,并且愿意付费,就是它的变现和使用时长的问题。没有足够好的落地场景,大家会在想这个问题。

另外就是有一个很好的落地场景,我们每个人每天都很高频的搜索,我肯定觉得这个场景非常好,但是技术还不够好。比如说我要做一个搜索,需要很高频的依赖于意图识别,我必须先了解这个人搜的问题,我应该用什么样的原子化的能力来满足他。所以我做了这两三个月下来,我发现现有的技术,不管是意图识别的准确度,还是说AI回答判断的能力都是不够的,是不够理想的。所以我很难把我的产品做得很好,主要是我依赖的技术还不够好。

刘飞:既然聊到你在做的搜索,我们刚才也提到知乎有独特的数据,对于其它的平台,你觉得做搜索的关键是什么?是它拥有的数据吗?是不是小红书也有一个AI的搜索,因为它有自己的数据,还是说其它的因素会影响到AI搜索?

艾逗笔:我有一个观点,我觉得AI搜索的第一性原理,就是它一定要满足准确度的问题,它的准确度要足够高。影响准确度的方面很多,第一是数据,就是你依赖的挂载的知识库准不准。小红书、知乎或者公众号保证了它的数据的质量,这一块是有一定帮助的。除了数据之外,还要有整个搜索全流程的一些方面。数据的搜索前置有意图识别,我觉得意图识别是非常关键的一个地方,就比如说知乎,它的数据精度非常高,有时候你用直答去问,它不一定能完全理解你想问的问题,所以就算它有很好的数据,它也不能给你很好的答案,所以在数据之前,对于用户意图的理解是非常重要的,这是最关键的两步。

再接下来一步就是最终呈现的形式,比如说我识别得非常准,我知道它就要问这个问题,我也找到了一份非常高质量的数据给到它,最后我怎么样用一种比较好的形式让它看着就觉得很满意?比如图文并茂,还是说我直接快速给它一个回答,还是给它一些参考信息,允许它二次创作。所以我觉得对意图的识别,以及给一份高质量的数据,再加上最后的展现形式,这三个环节非常重要。

刘飞:OK,感谢艾逗笔。我想问一下君晨,你刚才表达的。

延君晨:你太会cue我了,我正要提反对意见呢。

延君晨:我觉得既不缺技术不缺场景,反过来的,怎么说呢,我觉得现在是缺人。模型技术现在好不好?肯定有问题。大家都是这个行业里的,知道里面的坑很多。但是够不够用呢?肯定够用了。目前也涌现了很多的产品,虽然娱乐性的多一点,但是我们也看到工厂里面,包括每天我们习以为常的很多产品里的应用,比如小红书里的内容生成、抖音里的自动客服、工厂里的自动化,还有很多具身智能的东西,已经开始涌现了,今年下半年会有很多产品应用涌现出来。至于它有没有问题,肯定有,但我觉得不是现在的关键问题。至于有没有好的落地场景,我觉得也不存在,理论上未来所有的公司都是AI公司,不是我说的,是理想汽车说的,他们认为自己也是一家Ai公司。所有公司的内部基建都会用AI重新做一遍,这是一个非常令人兴奋的事情。但是这里面的问题是缺人,我观察到走在前面的公司和走在后面的公司,唯一的区别就是公司里面有没有专门的人基于大模型的理解,重新构建自己的软件工程,包括应用的开发范式,包括和运营、业务的,商业化的怎么结合,这些问题,我看到做得好的企业很少,核心还是没有人,我觉得需要一定的市场的培育和一部分传统的产品经理转型,我觉得这一波是产品经理很好的机会。我也是产品经理,但是很多产品经理还在纠结、感慨于上一个时代,还没有涌入到AI时代中,我觉得是很可惜的。

刘飞:你的感受是AI的产品经理对比上一时代需要具备什么样的能力或者素质?

延君晨:To C和To B不太一样,我简单说说To B和To G这个领域,这是我比较擅长的方向。上一代的产品精力更重要的是找需求,设计好链路,做好增长。这一代的产品经理是要把大模型的可靠性,如何收敛在技术能触达的地方,以及要降低一个产品从生产出来到投产的预期。传统的软件工程里面很多东西做出来就是80分的东西,基于大模型的东西,我觉得艾逗笔最有发言权了,他做出来的东西肯定距离投产还有50%甚至更长的空间,甚至需要大量的时间去优化,所以对于以前DevOps的需求会急剧上升,所以对产品经理来讲,软件工程的优化这一块要更多的理解,他要成为一个DevOps的专家。

刘飞:调试的过程会拉得很长,不像以前确定性很强,一个功能要做就直接落地了。

延君晨:我看到很多独立开发者说我做出来的东西跟我的预期不符,我就放弃了,或者说技术上不成熟。Midjourney就是一个特别好的例子,它每次迭代的进步都非常大,中间有巨大的调试工作在里面。

刘飞:说到这里,我看卢炜英一直在点头,你们现在在做这个事情的时候是不是也会遇到这种要反复在技术上做迭代,不是像之前那么确定的场景?

卢炜英:没错。我自己和你完全相反,我觉得是既缺场景,也缺技术的,这可能跟我们做的赛道相关。比如我们同样做AI视频这个大赛道,所有人都看到机会非常大,我们团队现在同时在做两款产品,一个是开拍,它的落地场景已经验证了,但是它里面有非常多的功能,或者说提供给用户的能力,现在是想要有更好的技术。另外一款产品,因为我们公司自己也有做视频大模型,从今年二三月份Sora出来之后,我们的大模型也一直在迭代,一直在调试,但是我们越调到后面,越发现它是一个很强大但是很难落地的东西。我们针对这个问题就想把这个视频大模型落地,就做了另外一款叫做Moki的产品,现在还在做,还没有上线。

我想表达的是,针对具体的场景,有些时候是技术还差一点,有些时候是落地场景还差一点。

刘飞:现在到陈亮这边,你是支持哪一方?

陈亮:我中立,技术是用来解决问题的,举个例子,我们现在的手机,可能我要买一个2万块钱的手机,我只用微信,这就是技术很牛,但是产能过剩了,没有用到它80%的能力。我觉得技术服务于产品,产品服务于用户的需求,从这个链路来看,我觉得能够解决问题的技术就可以。再更高级的应用,比如说美图后面还会不会发展出更厉害的视觉,如果做出来没有人去用,没有持续的反馈,这个技术可能也就没有得到深化的机会。从我们现在做的业务上来说,智能问答库、WPS AI也不会先过度追求多牛的技术,可能更倾向于先解决用户的问题,从用户的角度来说,我们需要什么样的技术,然后再去进行打造。当然也不是说我们不从技术侧考虑问题,毕竟AI的落地是技术驱动的模式,它没有绝对,只是在相对的场景下折中选择不同策略的过程。

刘飞:顺着这个话题往下聊,在金山做一些产品功能尝试的时候,有没有发现像你刚才说的这个大模型很好,但是用不上的情况?它跟场景之间可能不是那么匹配,在使用的过程中,这段时间有没有遇到过哪些坑?

陈亮:其实都会有。因为今天有直播,我不方便讲一些内部的事情,我抽象一下。比如现在我们要做一个表格的解析,表格有简单的,也有复杂的,比如有多表格合并、单元格合并等等。虽然今天我们能解析出来,但是大模型不识别,因为表格不含语义,单纯从语义这个方向来做,它的效果不太好,可能下一代的技术,或者是即将到来的大模型,它本身的基座或者chat模型的智能化程度,这个问题就能解决,又或者在它做工程化的解决手段,比如说图谱的rag,这是一个不断反复验证、反复试错的过程。

刘飞:说到反复调试、反复做,涉及到一个问题,现在大团队、小团队都在做这些事情,大公司都有自己的AI部门,也有艾逗笔这样的独立开发者,你觉得在做AI场景尝试的时候,大公司更有包袱还是更有优势?你面对大公司做的产品,你觉得独立开发的优势是什么?

陈亮:我觉得独立开发的决策过程比较快、链路比较短,这是一个最大的优势。从效率来说,我今天早上想到一个点子,可能下午或者晚上就实现了,Demo就出来了。大公司有一个比较谨慎的决策链条,这是一个区别。
第二点,大公司是比较规范的,它会有各个部门协调配合,说白了就是一个团队作战的模式。还有各种因素都会比开发者快速响应方面稍微有点欠缺,但是优势方面,大公司有用户、有数据,或者还有一些专业的技术沉淀,包括一些可以复用的东西,这都是比个人开发者要有优势的地方。

艾逗笔:我觉得一个点是试错成本。独立开发者做一个东西,我可能不太需要关心这个产品的成败,我努力去做,如果没做起来,我换一个新的方向去做就可以了。大公司如果要换一个方向或者换赛道,是非常困难的。我独立开发已经换过好多个赛道,试错成本非常低,然后也没有太多的决策链路,我今天想到今天就把它做出来。

陈亮:Demo随便上。

刘飞:这两年出现了很多AI绘图或者AI图片生成、照片处理的应用,你们会有一些担心吗,面对小团队会有一些担忧吗?

卢炜英:这个还好吧,大家一起做。

刘飞:你们会刻意地去关注这些吗,还是说你们更多从公司自己的战略方向出发去做这些事情?

卢炜英:首先只要是影像与设计的领域,无论是大公司还是个人开发者,我们都会关注,这也是跟我们的战略在一个路线上的。但是这个过程中我们也踩了挺多坑的,就以AI图像应用来说,现在大家非常熟悉的AI写生、AI生成人像的玩法,去年有一款非常火的妙妙相机,现在已经淡出大众视野了,其实我们比他们做得更早,在去年年初就上了,但是我们的效果没有他们的好,所以它一上就爆了,我们比它早一两个月上,都没有爆。后面我们也在反思,因为我们刚开始做AI的产品,经验不够多,主要还是因为数据不够,质量方面也不行,后面我们去迭代、调试,如果站在现在的时间上来看的话,无论是数量还是质量上都会比妙鸭更好,这也是我们踩的坑。

刘飞:作为美图来说,它有更长的时间,或者更长的耐心迭代,因为你有忠实的用户和场景,你更有耐心,不用说一个点打爆,可以等到时机成熟再做。
君晨,你还是比较特殊的,你既不是大公司,又不是独立开发者。

延君晨:但是面对的问题是一样的,我们是去年5月份上了第一个版本,当时很开心,没人跟我们做类似的事情。紧跟着GPTs出来了,扣子出来了,元器出来了,百炼出来了,百度还专门把他们的产品改成Agent builder,大厂只会慢一点,给你的生存期不会很长,6到12个月最多了。这个竞争关系必然会存在,所以你需要找到跟大厂不一样的地方。我们在创业之初是一个产品驱动的公司,我们团队内的4个创始人,2个半是产品经理背景,所以我们做事情的时候,我们要想不会被大厂吃掉的点在哪里,所以我们找了几个点,第一个是做全球化,第二个是开源,第三是面向开发者,这也是大厂商做不好的事情,我们找了这样几个云厂商在过去的历史经验中做不好的事情。

刘飞:你跟很多独立开发者都有过接触,你现在有看到过什么让你眼前挺亮的场景或者方向吗?

延君晨:To C很难,有各种原因,有些原因不方便在直播的时候说。我前段时间跟海外的一家公司有过一个交流,他们一起步就做全球化的原因是他们那个市场太小了,只有把这个产品做成全球化的,公司才有可能发展,这是一家成立了40年的公司的董事长跟我说的原话,所以我当时很有感慨,我们这一代算是没有什么包袱的创业者,其实应该一开始就考虑做一个全球化的产品。我经常听别人说AI+出海很热,我觉得这个词就是一个伪命题。刚才也说到了,现在所有公司都是AI公司,我们现在做的所有产品都应该从全球化的角度考虑,你就默认就是全球化的,不存在出不出海的问题。

这又回到Dify的创业初心,我们以前做了很多Copy to China的事情,我们那时候就看到海外有一个东西,国内没有,我们做一个类似的,在国内卷三五年,国内卷不动了,我们再去卷海外,发现海外的生态已经形成了,根本没有你的机会,你从低往高打很难。但是AI这一波有一个很好的机会,全球起点差不多,虽然国内的大模型或者应用比海外慢,但其实慢的很少,我们看到很多国内的大厂在海外的产品,包括教育、娱乐等等方面都做得很好。所以现在是一个几十年一遇的中国创业团队或者技术公司能跟海外尤其是硅谷的团队站在同一起跑线竞争的机会。

刘飞:艾逗笔本身就是独立开发者,你在尝试的时候会有自己的原则或者标准吗,要做什么样的场景,要做什么样的产品,你会通过什么方式去确定这个方向?

艾逗笔:刚刚君晨讲到全球化是现在一个很大的趋势,而且AI是一个非常大的机会,AI+全球化也是不管做独立开发还是大公司都会尝试的方向。我做产品,一方面我会每天看很多不同类的产品,我决定要不要做,一般有三个原则:第一,它是不是我感兴趣的,第二,它是不是非常有价值的方向,第三,它是不是在我的能力范围内,只要满足这三个原则,我基本上都会做,包括去年做资料阅读摘要,去年也做过音乐播放器,今年也做过AI试衣,一共做了七八款产品,直到今年3月份才做AI搜索,我觉得都是属于满足我刚才说的三个条件我就去做了。

刘飞:听起来你还是非常灵活,完全可以兴趣驱动,像坐在你旁边的两位都是大公司的,他们就不能想做什么就做什么。陈亮能不能介绍一下,AI在去年变成一个大家都在讨论的事情之后,你在公司内部发生了哪些变化,会有一些部门调整或者说流程上的调整变化吗?

陈亮:其实会有调整,从ChatGPT出来到现在大家的认知,包括对它的理解都在逐步的加深,从一开始大家觉得这个东西能够帮我解决很多问题,它能够回答很多提问的问题,到后面大家把它落到真实的用户场景里面去,这里面其实有一个思维、技术和各种理念变化的过程。随着这些变化,公司的组织架构也会有一些相应的调整,来适应战略的实施。所以这个变化是肯定有的。面对变化我们要有一个明确的心态,拥抱变化,然后它会让自己得到成长,这是在AI这个时代下,每个人不能独善其身,或者说多少都会受到影响。在这个背景下,艾逗笔这边,个人开发者有它的优势,但是还会面临商业化的问题,因为作为一个商业化的产品,还是需要一定的团队协作的方向或者资源,面对变化,我们要意识到在公司内的做事方式,以及独立开发者做事方式的调整。

刘飞:刚才我们说的都是之前发生的事情或者当下在做的,你可以畅想一下,在你的视角里,你会觉得什么样的AI技术或者什么样的AI应用场景会有一个非常显著的爆发或者增长,或者大的变化,或者谈你个人期待的方面也行。

陈亮:抛开公司立场,我认为娱乐方面是比较容易出现增长的,我们每天可能有百分之二三十的时间都花在刷短视频上面,本质上是一个碎片时间消耗的场景,伴随着场景需求的衍生,会出现很多创作者,包括开发者、公司,也会想办法用AI来更好地满足需求。说白了可能是一个体验的升级迭代,我觉得娱乐方面,再结合生成式AI物,包括GPT4o、多模态的发展,从图文到音视频,都会有一个比较长足的爆发的机会点,因为娱乐的准确性要求不太高,让我看到开心就可以了。

刘飞:卢炜英觉得接下来有什么爆发的方向?

卢炜英:我觉得各行各业都有机会,但是对其它的行业我不太熟悉,就不敢妄议。主要说影像与设计吧,我们是觉得和影像相关或者生产力相关的也是会有很大的机会,我说的生产力相关并不是要求很精确或者很复杂的系统,但是AI因为有一些自然语言或者是直觉的生成,我们认为在未来生成这个动作会比拍摄更普遍,这也是为什么我们公司现在All in AI的一个很底层的思考。就像我们公司做很多产品,比如说Photoshop很复杂,我们做了美图秀秀,因为用AE或者用剪映很复杂,所以我们做了开拍,我们相信借助AI的能力,我们可以在生产力方面给用户创造一些新的场景,或者是老的场景,但是提供新的能力。

陈亮:顺着卢炜英的话题,我觉得在公司层面,办公的场景提效这一块我们也非常看好,金山办公有文档这一块的数据,基于用户的写、存、管、用这几个场景,未来AI在智能化程度以及工程化能力的加深,在办公场景也会有比较不错的增长。

延君晨:我觉得无论对个人、初创公司还是大公司都是一样,现在真的是要上手折腾,这也是我们公司的核心价值观之一,我们公司人人都要会写代码,因为大家都是技术背景,我们招人的时候也会招复合型的人,一定要有上手折腾的能力,你才能从一个空洞的技术变成解决一个具体的问题,然后忘掉技术。

再讲一个我们公司的真实案例,我们服务过一家世界500强公司,他们过去用Langchain花了一年时间,投了很多钱来解决问题,后来迁到Dify上一个月左右就解决了同样的问题。

又回到刚才说的上手折腾,解决一个具体的问题,如果你还是不能忘掉技术的话,你可以试一试用这样的产品试着把AI落到跟个人或者跟公司业务相关的问题上,让它形成闭环,不要天天研究这个技术本身,我觉得没有意义,这也是产品经理的一个理念。

刘飞:最后请艾逗笔给大家也提一些建议,作为一个独立全栈开发者,你对现在做AI的朋友有什么建议?

艾逗笔:我经常讲的一个词叫“袪魅”,因为AI是一个新的机会,很多传统的软件、行业是有机会被改变甚至被颠覆的,所谓袪魅也就是说不管是初创公司还是独立开发,你要摸清它底层的技术原理,比如说我决定做AI搜索的时候,有些人可能会觉得谷歌、百度AI搜索做了几十年,你要做一个新的搜索,你会觉得很难,但是袪魅的话,你会发现里面有一些你可以做到的事情,比如说它的原理可能很简单,就是要袪魅。

第二是要多尝试,你要先想清楚用AI可以在现有的阶段做到哪些事情,然后再果断去做,做的过程中发现有什么痛点,或者有什么其它不能很好满足的点,自己再把它完善做好就好了。

刘飞:时间关系,今天的圆桌就到这里,谢谢各位。

来源:知乎 www.zhihu.com
作者:知乎科技

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。 点击下载

like

dislike

love

funny

angry

sad

wow

李芷晴 https://tszching.uk