首頁  >  文章  >  科技週邊  >  獨家對話李岩:宿華、經緯、紅點資金支持,第一個「生成式推薦」新創公司|AI Pioneers

獨家對話李岩:宿華、經緯、紅點資金支持,第一個「生成式推薦」新創公司|AI Pioneers

WBOY
WBOY原創
2024-07-19 05:03:59828瀏覽

独家对话李岩:宿华、经纬、红点资金支持,第一个「生成式推荐」创业公司|AI Pioneers

人類正在迎來人工智慧領域的爆炸性更新,技術朝向未知拓展的每一步,幾乎都引起驚人的關注度。

在人工智慧邊界擴張的過程中,重要賽道的技術路線創新與分歧並存。技術先鋒者的判斷與選擇,影響著眾多跟隨者的腳步。

過去一年,本站獨家率先將月之暗面、生數科技、愛詩科技、無問芯穹等優秀公司介紹給大家,為他們在互聯網世界留下了第一份「萬字訪談底稿」。在科技路線尚未收斂的階段,我們看到了到真正擁有信念、勇氣以及系統化認知的 AI 創業家的引領力量。

因此,我們推出「AI Pioneers」的專欄,希望繼續尋找和紀錄AGI 時代人工智慧各細分賽道具有領袖氣質的創業者,介紹AI 賽道最出眾、高潛的創業公司,分享他們在AI 領域最前衛、最鮮明的認知。

独家对话李岩:宿华、经纬、红点资金支持,第一个「生成式推荐」创业公司|AI Pioneers

作者:姜菁玲

本站報道

離開快手創業後,「李岩」悄悄拿到了快手聯合創始人宿華、紅點創投以及經緯創投的3200萬美金種子輪融資。

作為快手初始AI體系的核心人物,李岩曾搭建了快手內部第一個深度學習部門,後來還幫助快手搭建起了多模態內容理解Multi-Media Understanding 技術體系。

他的其中一位投資人總結,在教授學者、行動網路實幹派,以及學術小天才,這三派AGI創業畫像裡,元石科技是唯一有能力整合「多模態、搜索、推薦」這三大核心技術堆疊的團隊。

不過,自2023年初李岩正式確認自己創業後,一年多來,他就幾乎消失了。

過去一年中,我們向李岩團隊發出過多次採訪邀請,希望跟他聊聊他的創業想法,都被「產品尚未準備好(公開)」婉拒。

不久前,元石科技的產品「問小白」正式上線,冷啟動內測開啟,這也是李岩團隊第一次創業進度揭露。於是我們再次找到李岩,希望和他聊聊他的創業計畫。

在這次獨家專訪中,出乎意料的是,李岩的選擇並不是一個純模型公司,甚至也沒有從多模態方面切入。

在「問小白」這個產品中,用戶開屏即在「feed」中,看到由AI針對用戶興趣個性化生成的AIGC內容,並可隨時用“chat”功能與AI基於內容做更多的互動。
独家对话李岩:宿华、经纬、红点资金支持,第一个「生成式推荐」创业公司|AI Pioneers
可以理解為,這是一個基於自研LLM模型的生成式內容社群產品,與先前的內容社群產品相比,李岩的動作在於「生成式推薦」。

這是一個前沿的技術研究領域,至今只有Meta與CMU有一些落地成果。他告訴我,相較於先前的推薦演算法,生成式推薦演算法將不再基於協同過濾的推薦系統,推薦將變得更加智能,從當下的「千人十面」變成真正意義上的「千人千面」。

透過使用者更深層需求的挖掘,推薦效率進一步提高,使用者能夠得到與自己更匹配的資訊。而且,大量高品質語料對大模型的灌輸,讓生成式推薦演算法擁有「價值觀」。可以不再只是「討好」用戶,而是引導用戶專注於真正需要關注的優質資訊。

目前在國內,李岩團隊是首家以LLM驅動的生成式推薦演算法作為產品核心和發展方向的創業公司。

元石的一位投資人認為,這種新的技術引擎在內容行業帶來的成本與效率上的優化,與今日頭條的成功路徑基本一致。 而在做生成式推薦演算法產品這條路上,「我們看到,同時具備多模態、搜尋、推薦三種背景的團隊可能只有李岩」。

Vision:做更高維度的推薦演算法   什麼事?

李岩:
我們希望透過科技創新,匯聚智能,幫助使用者進入心流狀態,對抗精神墒。 (來自米哈里·契克森米哈賴的「心流」理論)

本站:有點抽象,能否再解釋下?

李岩:
我們覺得當下是一個資訊爆炸的時代,接收資訊的管道很多, 但是真正能夠獲得自己關心資訊的管道缺失了。

例如最近的WAIC,可能你會看到鋪天蓋地的報道但是每篇報導都是只言片語,但你並不能獲取到你真正關心的信息,這時候你反而會陷入一種焦慮。

我們理解這是一種「精神熵」,
這個概念是一個心理學家米哈里·契克森米哈賴提出的,跟我們希望做的事情非常準確地匹配。我們想做的事,就是幫助大家提升看到訊息之後的幸福感和收穫感。這種狀態跟當下我們重度使用一些資訊產品過後的「更焦慮、更疲憊、更開心」會有所區別。

本站:什麼樣的訊息會讓人看到更幸福、更有收穫,而不是更焦慮、更疲憊?

李岩:這裡有一個「心流」的概念,它指的是,人只有看到自己真的想看到的資訊的時候,才會進入心流狀態,從而感受到幸福,而不是去看到很多跟自己無關,或是不感興趣的事。

這同樣是一個心理學研究結果,舉一個具體的例子,比如父母讓小孩寫作業,雖然最終是落實了,但小孩是被動的,他非常痛苦,他只有在做自己想做的事情的時候,他會覺得自己很快樂。所以我們希望幫助用戶進入心流的狀態,對抗精神熵。

独家对话李岩:宿华、经纬、红点资金支持,第一个「生成式推荐」创业公司|AI Pioneers

本站:現在其實大部分社交社群的底層推薦系統,本質上也是希望實現這種目標(給用戶推ta真正想看的)?

李岩:是有區別的。假如我們站在十年後,2034年看今天的推薦系統,包括產品和背後的技術,其實是非常落後的。現在產品所做的這些,其實並沒有達到一個很完美的狀態。

本站:怎麼理解目前的水平和「更好」的水平?

李岩:我可以做個類比,目前的訊息分發更像是原始人類階段的本能反應,在精神並沒有太豐富的階段,可能人的本能就是「我要吃飯」、「我要哭」、「我要笑」,這樣很直接的。

反應在推薦系統裡,可能就是,比如你喜歡帥哥,就會一直給你推帥哥——推薦系統並沒有過多的深入思考。而我們的產品希望做到的是,不是對使用者本能反應的討好,而是帶著更高的智慧,帶有關心和愛的推薦。

本站:這個聽起來是一個美學上更高的維度,有點想要「教育用戶」的意味。

李岩:準確地說並不是教育。很多事情在一個比較短的周期去看,是看不清楚的。但比如說我們拉長到整個人類發展的歷史上去看,我們會發現人類文明的每一次前進都會伴隨著批判、反思甚至推翻、重構,一些東西在當下是看起來不錯的,但在未來這可能就是有局限的。在網路世界也是這樣 ,我們希望把更文明的成分,人類所累積的先進思想帶到內容分發當中去。

独家对话李岩:宿华、经纬、红点资金支持,第一个「生成式推荐」创业公司|AI Pioneers

技術實現路徑:選擇更高品質的資料訓練模型,讓模型有價值觀


本站:說是希望做一個幫助用戶說是希望做一個更好的內容產品,為什麼會從做一個更好的LLM這件事著手?

李岩:我們認為LLM是通往AGI非常重要的節點。大語言模型可以做到,更好的去理解用戶、理解內容,知道用戶關心什麼、喜歡什麼、不喜歡什麼,用戶個人的所有的興趣愛好可以tokenize,而大模型可以很好的去理解。

之前的推薦系統是無法做到這種程度的理解的,它只能給這個用戶打上很多離散的標籤,透過這個去嘗試刻畫和理解用戶。現在,大模型不僅可以更好地理解用戶現有興趣,還能增強對用戶興趣的挖掘,推理出用戶隱性的興趣愛好。

有了大模型之後,我們能夠對全互聯網上最高質量的語料進行壓縮,對承載在文字裡的人類文明進行壓縮,從而使用這些文明,進一步將這些能力用到生成式推薦上,它就會擁有它的價值觀、世界觀,從而有一個更高維度的推薦價值體系。

大模型其實是承擔了一個橋樑的作用,把這些最先進的認知與你的資訊消費連結起來,然後進一步提升你的內容消費水準。

本站:這些「先進」內容指的是論文是嗎?是社會科學還是自然科學方面都包括還是偏向哪方面?

李岩:大模型會讀取整個互聯網上人類積累的所有先進文明和信息,它在方方面面都可以是先進的。

本站:大模型怎麼判定什麼是「先進文明」?

李岩:其實我們人類已經對這件事情做過判斷,而不是大模型,比如說我們權威的論文期刊、知名學者寫的書,這些並不是大模型界定的,而是人類自己長期以來建立的高品質資訊。

本站:嗯嗯,那這部分高品質資料具體是什麼呢?來源?

李岩:我們看重數據驅動的模型能力建設,在我們模型裡面,我們利用演算法將可利用的高品質資料數量提升了超過一個數量級以上。另外,在數據的選擇上,我們更採用,經典的書籍、理論、論文,這樣的數據去訓練我們的大模型,從而使得我們的模型有了更加深度理解用戶的能力,更具體來講,在內容推薦這件事上,我們不會一味讓使用者停留在短期快感內。而是同步有累積高品質資訊的長期快樂。
独家对话李岩:宿华、经纬、红点资金支持,第一个「生成式推荐」创业公司|AI Pioneers
本站:剛剛提到生成式推薦演算法可以提高對使用者理解程度,不同推薦演算法對使用者理解程度有沒有量化的標準可以比較?

李岩:由於不同公司追求的目標是不一樣的,因此優化目標也不一樣。一般來說可能是時長、點擊率以及留存。由於我們技術原理和業務方向是全新的領域,因此我們目前內部有一套非常複雜的資料體系,去評估這件事。

本站:在LLM上,目前元石技術上有什麼優勢?

李岩:我們從公司成立第一天開始,也就是2023年4月份左右,第一個版本的大模型就是MoE架構的。整體的技術路線選擇在市場上是有很多的前瞻性。從2023年4月份到現在一年多時間,我們的模型已經迭代了四個版本。在許多公開的測試集上,我們的效果比許多其他模型的表現要好。

另外,我們高品質語料讓回答的品質非常高,模型有深度思考的能力。第三,我們大模型速度也非常有競爭力,延遲極低。我們透過對模型訓練和推理做了極致的優化,讓我們訓練大模型的成本大大下降,我們現在是免費的,不需要大家在高峰期給使用付費。

本站:為什麼你覺得MoE是比較優越的路線?

李岩:我們認為,要做自己的產品,需要有模型底層一體化鏈路的能力,大模型時代模型效果更好,往往意味著它參數量就大了。但是作為一個to c的產品,如果模型推理的成本很高,那麼商業上是不work的。所以我們既需要參數量很大,又需要推理成本很低,作為商業上可行的前提,最終只能選擇MoE。我們是從第一天就想清楚了這個問題,我們寫下的第一行程式碼就是MoE的。

本站:因為元石定位是一個應用公司,在研發過程中有沒有考慮去使用一些開源模型,這樣可能會更經濟一點。

李岩:我們的目標並不是做一個模型層的公司,但我們還是選擇自研大模型的原因在於,我們認為其他人的模型並不是為我們的目標服務的,我們是一家由自有大模型驅動的產品公司。

我們沒有在模型層的商業模式上做過任何嘗試,這跟我個人的認知有關係。有的人認為大模型是水和電,就是說我一旦做了好大模型,你們就不需要做了,都調用我的能力。但我們認為大模型更大的意義在於說極致服務使用者的能力,場景化的能力,它在一個固定的場景,把使用者服務的更好,提供了之前完全沒有的體驗。

另外,事實證明微調改變的能力是有限的。因為我們做這個事情的創新性還蠻大的,需要在底層模型架構上做大的改變。我們內部也會用我們自研的模型跟開源模型去比,事實證明,我們內部自研的效果要遠遠好於開源模型。因為這個模型是完全為我這個場景打造的,從訓練資料的建構以及演算法的設計都做了很多工作。

本站:你個人在多模態方面也是屬於國內探索的比較早的,在多模態方面有時間表嗎?

李岩:目前文本大模型還是核心中的核心。是智能的基礎。

独家对话李岩:宿华、经纬、红点资金支持,第一个「生成式推荐」创业公司|AI Pioneers

產品價值:能夠更關注用戶的個人化需求


本站:元石面上科技產品都不如市面產品會想要定義這樣一款產品?

李岩:我們不是一個針對特定人群的產品,我們面向廣泛的人群,我們也不是一個垂直內容社區。我們認為隨AI生成能力和分發能力的提升,AI時代未來的內容垂類的邊界甚至會越來越模糊。

在產品層面,目前我們產品有兩個功能,一個是Feed一個是Chat。我們叫「問小白」,一個方面就是使用者生活中有什麼問題,都可以去問ta。另一方面是由小白「問」,基於用戶問AI的問題,小白也會主動關心用戶,主動向用戶推送。名字叫小白,是希望用戶有安全感,親切感,拋棄掉冷冰冰的AI或暴力的AI,跟用戶是可以近距離接觸的。

本站:所以可以把它理解成一個帶有AI功能的內容產品嗎?

李岩:可以,在此之外它還是一個實時在線的了解你喜好的朋友,那作為用戶你有事你可以安排它,沒事它可以觀察你,看能幫到你什麼主動做點事。

本站:Feed流的內容全部是AIGC的嗎?怎麼保證這部分內容的品質?

李岩:用大模型生產內容的話,它首先是需要知道用戶喜歡什麼樣的內容,再針對這些議題去生成,高品質地組織文章內容。這兩個層面一方面是理解能力,一方面的生成能力,現在來看的話,這兩方面的能力大模型都還有很大的提升空間。也是之所以創業的原因,因為我們認為自己有能力將這個事情達到極大的提升。

独家对话李岩:宿华、经纬、红点资金支持,第一个「生成式推荐」创业公司|AI Pioneers

Ce site : Le produit ressemble un peu à la version IA de Zhihu, Xiaohongshu et Toutiao Par rapport à ceux-ci, quelles sont les différences et les avantages ?

Li Yan : Tout d'abord, nous accordons plus d'attention aux besoins personnalisés des utilisateurs. Pour tous les produits dont vous venez de parler dans la génération précédente, le principe le plus fondamental de leur système de recommandation est le filtrage collaboratif, c'est-à-dire que si un utilisateur aime A et B, et qu'un autre utilisateur aime A et C, alors B et C. sont également similaires. Ensuite, nous vous recommanderons respectivement B et C. Il y a un problème très évident avec cette méthode de filtrage collaboratif, c'est-à-dire qu'elle vous recommande toujours certaines catégories vertébrales.

Pourquoi ? C'est parce que si vous aimez un sujet, il y a de fortes chances que vous, comme les autres personnes qui aiment ce sujet, soyez plus susceptibles d'aimer les belles femmes et les beaux hommes, et ils ont tous tendance à aimer les divertissements. Ainsi, le système finira par déterminer que vous aimez réellement le divertissement et que vous aimez les beaux mecs et les belles femmes.

Cette méthode a ses avantages, elle peut rapidement faire gagner du temps à l'utilisateur pour continuer à se développer. Mais son problème est qu’il enterre les intérêts personnels et les intérêts de niche des utilisateurs, ce qui rend difficile la compréhension détaillée des utilisateurs.

Et nous faisons cela à partir de grands modèles. Tout d'abord, nous espérons prendre soin de vos intérêts personnalisés, plutôt que de vous recommander des beaux mecs, des beautés ou du contenu de divertissement. Dans ce cas, ce système de recommandation n'est pas un système de recommandation véritablement personnalisé.

Ainsi, un système de recommandation suffisamment intelligent devrait théoriquement être capable de prendre en charge tous les intérêts des utilisateurs. Qu'il s'agisse de vos intérêts généraux ou d'intérêts personnalisés de niche. Jusqu’à présent, on n’en a pas fait assez.

Ce site : Pourquoi avez-vous choisi cette direction lors du démarrage d'une entreprise, au lieu de la forme courante de chatbot ou de produit de compagnonnage émotionnel ?

Li Yan :Nous pensons que l'intégration LLM avec recommandations a l'opportunité de définir un nouveau type d'interaction, une expérience fluide qui ne nécessite pas d'interaction « active ». À l'heure actuelle, les interactions pures de type chat ont encore certains seuils d'utilisation pour les utilisateurs, et les utilisateurs doivent activement lancer des questions. Dans une certaine mesure, cela limite également la pénétration et l’utilisation d’un plus large éventail d’utilisateurs. En plus de tous les produits recommandés que nous utilisons aujourd'hui, même si les utilisateurs les utilisent beaucoup, nous voyons encore des utilisateurs les désinstaller à plusieurs reprises. Faire semblant à plusieurs reprises signifie qu'il ne peut pas vivre sans, mais reporter cela à plusieurs reprises signifie qu'il n'est pas satisfait à 100 %. C’est un point qui nous fait penser que les produits recommandés ont encore de grandes opportunités.

Sur cette base, nous pensons que l'expérience de notre équipe est très appropriée pour ce faire. Personnellement et l'équipe avons une profonde expérience dans la recherche, la recherche sur l'IA et la mise en œuvre de produits à grande échelle.

独家对话李岩:宿华、经纬、红点资金支持,第一个「生成式推荐」创业公司|AI Pioneers

Ce site : Cependant, les produits basés sur le contenu se heurtent actuellement généralement au dilemme de voies de commercialisation peu claires et ne connaissent pas beaucoup de succès. Qu'en pensez-vous ?

Li Yan : Nous en sommes encore au stade de démontrer plus pleinement la valeur de nos utilisateurs. Il est logique de parler de valeur commerciale basée sur une grande valeur utilisateur. De nombreux produits ont fourni des exemples très réussis des fortes capacités de monétisation de produits à contenu à grand volume, tels que Kuaishou.

Ce site : Retour au produit, quelle est la valeur du produit avec une meilleure capacité de réponse ?

Li Yan : Je pense qu'il y en a deux. La première est que plus vos réponses sont bonnes, plus la fidélité des utilisateurs sera élevée. Dans ce cas, vous pourrez connaître plus de signaux utilisateur et mieux comprendre les utilisateurs. En fin de compte, le système peut les utiliser pour créer du contenu pour les utilisateurs qu'ils aiment et dont ils ont réellement besoin. Formez continuellement une expérience positive et un cycle de données.

Ce site : En pensant avec optimisme, quel impact la maturité progressive des algorithmes de recommandation générative peut-elle avoir sur l'industrie du contenu ? Dans votre imagination, à quoi pourrait ressembler un « Ask Novice » mature ?

Li Yan : La recommandation générative injecte une nouvelle vitalité dans la piste de contenu, permettant d'apporter d'énormes changements dans ce secteur, plutôt que d'élaborer des améliorations.

À l'heure actuelle, les grands modèles et autres technologies connexes progressent à pas de géant, mais il existe un goulot d'étranglement évident dans la communication homme-IA. Nous avons la capacité de faire mieux dans les deux aspects. Demandez à Xiaobai, demande Xiaobai, nous espérons promouvoir grandement l'inclusivité de la technologie de l'IA et permettre aux utilisateurs ordinaires qui ont davantage besoin de l'IA de ressentir la puissance de l'IA.

以上是獨家對話李岩:宿華、經緯、紅點資金支持,第一個「生成式推薦」新創公司|AI Pioneers的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn