打破了語言矩陣!?
謝爾蓋布林打了個激靈,視線馬上重新回到了屏幕上密密麻麻的曲線圖上。
搶過德米斯哈薩比斯手中的鼠標,謝爾蓋布林不停地向下滑動著鼠標滾輪。
大周語、普魯士語、高盧語、盎語、倭語、大毛語、西拜語、葡圖佳語、意呆利語、巴拉特語……
超過三百張曲線對比圖無一不是在說明這樣一個事實——
juzi25十五種語言的各種性能曲線,幾乎全都在同一水平線之上!
無論是理解和記憶,推理與認知、自主規劃和決策、自我優化與學習、情緒與社交模擬、工具調用……
除了生成和表達存在較大的波動值之外,其他幾乎所有能力的性能,尤其是推理和認知,在各種語言環境下,幾乎是完全一樣的!
連百分之一的差距都沒有!
這怎麼可能!?
這完全違背了大模型的原理!
“是不是通過參數調整,把所有語言的性能進行了拉齊操作?或者本身先翻譯成盎語後,用盎語思考,再翻譯回思維鏈?”
謝爾蓋布林感覺自己瞬間頭頂和腋下就冒出了汗。
人工智能,所謂智能,就是思考,而思考,就需要語言,無論人還是計算機,都不可能脫離語言來思考。
大模型ai更是如此。
這些大模型,可能掌握了全世界所有的語言,但使用不同語言進行思考時,大模型的在不同方麵的性能表現都是不同的。
一來,是因為不同語言訓練資料的多寡和質量的差異。
在當今的互聯網時代,盎語語料當然是最豐富的,占到互聯網整體資料量的百分之八十以上。
alhazero在使用盎語進行理解和推理的時候,正確率相對其他語言會高5以上。
二來,各種不同的語言本身就存在不同的“表達偏重”和“性能差異”。
比如普魯士語,在結構推理方麵的速度比盎語更快,西拜語則在感性類語料中優勢明顯。
而大模型在一次思考回路中,通常使用單一語言構建其推理路徑。
雖然它可以在輸入階段識彆多種語言,在輸出階段進行翻譯,但其內在的認知張量結構,仍舊傾向於使用輸入語言所構建的token空間進行語義演算。
說人話,就是大模型在思考問題的時候,在一個思考回路中,基本隻會使用一種語言來思考,你使用盎文,它就用盎文思考,你使用周文,它就用周文思考。
就算它在回複中摻雜了其他語言,也隻是一種資料引用或人類寫作風格的模仿,而不是真正的跨語種思考。
橘子大模型又怎麼可能使用不同語言思考的時候,各方麵性能都差不多的?
這完全不符合常理!
唯一的可能性,就是對各種語言的思考性能進行了拉齊操作。
說白了,就是一個木桶,以最短的那個板為基準,把高的板子都砍了。
但這樣做意義在哪?
德米斯哈薩比斯猶豫的搖搖頭:“應該不是,拉齊操作資源浪費太嚴重。”
“至於說是不是先把思維翻譯成盎語或其他語言……”
德米斯哈薩比斯停頓了一下。
“我一開始也是這麼認為的,但經過測試,並非如此。”
說罷,哈薩比斯把實驗報告翻到中間。
“你看‘抽象歸納’和‘形式推理’這一部分的能力,哪怕在應用‘馬拉亞語’時,juzi25依舊能夠準確進行抽象歸納和形式推理。”
“比如這個實例,在情感理解方麵,我們的實驗人員要求juzi用馬拉亞語思考並使用盎語將結果輸出後,針對實驗人員的任務回複中,橘子大模型並未簡單的將馬拉亞語中的‘anja’翻譯為‘aered’或‘affectionate’。”
“而是采用了實際語義下的不同表達。”
“比如第一段,它對‘anja’的翻譯是‘可愛又粘人’。”
“而在第五段,思維鏈中同樣是‘anja’,但因為主體變了,在馬拉亞語中‘anja’的含義也產生了微妙變化,這時,它將這裡的‘anja’就轉化成了‘被寵溺’。”
德米斯哈薩比斯摘下眼鏡,擦了擦,眯著眼:“盎語中原本沒有對應anja這個詞的準確翻譯,但經過這樣轉化後,哪怕是一個從未學過盎語的馬拉亞人,說出的盎語也不再會讓人有任何的誤解。”
謝爾蓋布林看向德米斯哈薩比斯指的那張曲線圖,渾身汗毛都立起來了。
作為技術宅和古狗老板之一,他現在肯定不是技術最好的,但對人工智能的理解和認知絕對是世界上最頂尖的一批人。
這怎麼可能呢?
馬拉亞語因為是孤立語種,語法結構較為扁平,文化語境偏重於口語化和情景驅動,這使得它們在抽象、哲學、技術等領域的表達中先天存在一定限製。
這導致部分高階概念性詞彙在語言本體中缺乏,往往隻能依靠描述性轉譯或直接引入外來詞。
類似“意識”、“存在”、“主觀性”、“客觀性”這種哲學意象性的詞語,馬拉亞語中是不存在的,隻能直接借用外來語或
但同樣,馬拉亞語中也有相當數量的“柔性詞彙”是盎語和西方語係中沒有的。
這一部分詞語的含義往往非常微妙,詞典中對應的單詞其實或多或少都存在差異。
這也就造成了,用不同語料來訓練大模型,以及用不同的語言使用大模型時,ai對世界與關係的理解是存在微妙差異的。
這種“微妙的差異”看似無所謂,實則常是文化誤解與衝突的重要誘因之一。
“謝爾蓋,這裡有個更有代表性的,就是它對‘s’的理解。”
德米斯哈薩比斯點著觸摸板向上劃了劃:“你看這裡,這是juzi25g在同一個話題中,周文和盎文的思維鏈對照。”
“哦,可能你不知道,s,在周文中,一般翻譯為‘罪’,但周文中‘罪’這個字的意思範圍和s並不等同。”
德米斯哈薩比斯周裔混血,會一點周文,原本是分不清楚這裡麵細微的語義差異的。
但對於他這樣的天才來說,隻要他意識到其中的問題,開始研究這方麵,不需要太長時間就能對這種概念性的差異一清二楚。
“可一直以來,無論任何翻譯者,基本都忽視了這一點,隻是生搬硬套的直接把周文的‘罪’翻譯為‘s’,把盎文的‘s’翻譯為‘罪’。”
“juzi25則不同,在闡述法律問題的時候,它把s正常翻譯成了周文中的‘罪’。”
“而在後麵的信仰問題中,它視不同語境,對s的不同語義表達至少用周文做了六種不同表達,分彆是‘忤逆’、‘冒犯’、‘過錯’、‘忘恩負義’、‘邪道’和‘苦難’。”
“這些不同的表達,在各自語境中,恰恰捕捉了‘s’一詞在那個語境下最貼近原意的表達,基本不會因為用詞遣句的微妙差異而導致另一方出現錯誤主觀判斷。”
“哦,對了,就連‘主觀’與‘判斷’這兩個常見詞,在周文與盎文中也呈現出微妙的語義偏移。”
德米斯哈薩比斯眼神中充滿了思索後的震撼。
謝爾蓋布林眉頭緊鎖。
他當然理解德米斯哈薩比斯的每一個術語。
但他還沒有在“哈薩比斯的語言學介紹”與“juzi25在多語言條件下思維表現趨同”之間建立起完全的因果映射。
這似乎隻是……更好的翻譯軟件?
和橘子大模型的性能表現有什麼關係?
不對,這種表現不在現有多語大模型能力範圍內——這背後,肯定藏著某種我們未曾掌握的機製。。
這個機製能讓橘子大模型深刻理解了不同語言在不同語境下的精確含義,在翻譯中甚至使用了“解釋替代”和“語氣擬合”來更加精準的原文翻譯。
等等,看這個實驗報告之前德米說的什麼來著?
突破語言矩陣?
之前自己還稍稍有些疑惑,這個語言矩陣是什麼。
這麼說來……
“德米,你的意思是……juzi25的思考,並不是使用的某一種語言,而是……而是……”
謝爾蓋急的抓耳撓腮齜牙咧嘴,但就是找不到一個合適的詞來形容自己的理解。
“而是一種徹底打破了語言邊界、使用全世界所有語言形成‘高語義映射圖譜’。”
德米斯哈薩比斯深吸一口氣,給謝爾蓋補充道。
“高語義映射圖譜!沒錯!就是這個!”
謝爾蓋布林用力的一拍大腿!
“不過,這個用詞還是太專業了,如果形象一點說……它彙總全世界的語言,創造出了一種隻有它可以使用和理解的無歧義語言!”
“一種跨越語係、超越語義分歧的語言……這種語言,完全可以稱為‘全語言’。”
說完這句話,謝爾蓋布林臉都白了,抹了抹頭上的汗,眼神掙紮,似乎還是不肯相信。
“全語言,o,真的存在這樣一種語言嗎?”
“哪怕是一種隻有ai可以使用的語言?”
“但問題是,juzi199dec是開源的,其中根本沒有這部分功能。”
德米斯哈薩比斯點點頭:“是的,不光是199dec,最早的25版本也未實現這一點,當時各語言輸入下的性能表現差異仍相當明顯。”
“是從發布後第一次更新,也就是半年前的25n開始,具備的這個性能。”
“當時我們其實就有所發現,但沒有過分關注,就是猜測他們使用了拉齊的方式,或他們的盎文訓練語料不夠豐富所致。”
“但隨後他們的幾次版本更新,每一次都有性能提升。”
“在一個半月前,古狗大腦團隊的黎,在測試安南語等小語種的能力時,首次意識到juzi25新版本在小語種上的思維能力已經超過了安南語應有的極限,推理能力和盎語相差無幾。”
“那之後,我們才開始深入分析。”
“太震撼了,太震撼了。”
德米斯哈薩比斯搖著頭,同樣臉色發白。
“謝爾蓋,你應該知道,這意味著什麼。”
“橘子大模型連語言的藩籬都突破了,具備了優化和創造語言的能力,又怎麼可能沒有優化函數的能力!?”
“優化和創造語言,難度遠遠超過優化隻有邏輯推理的函數!”
“隻不過柚子科技不知道出於什麼原因,因此沒有把這部分功能釋放出來而已!”
“更重要的是,他們使用‘全語言’進行推理和認知,效率、準確率、乃至進化速度將會遠超任何一個使用單一語言進行推理的大模型。”
“這其中當然也包括我們的alhazero。”
“謝爾蓋,我們沒有勝算,一點都沒有。”
德米斯哈薩比斯再次摘下眼鏡,痛苦的閉上眼睛。
“就算alhazero能夠持續進化,真的實現從0到1的轉變,但從先天上,我們就不可能追趕上柚子科技。”
“他們打造的是巴彆塔,謝爾蓋。”
巴彆塔?
謝爾蓋布林臉色先是一白,緊跟著想到y搜就是一紅,然後再想到柚米os又是一黑。
跟喝了宮廷玉液酒似的。
也不知道是不是一百八一杯買的。
現在y搜的市占率雖然還不足以破壞古狗在全球搜索引擎市場的壟斷地位,但古狗內部都清楚,目前的領先僅僅是因為安卓所帶來的碾壓式移動端搜索量。
在桌麵端,y搜對古狗的市場侵蝕已經接近古狗的百分之四十!
還好在移動端,因為古狗是所有安卓手機除在大周外唯一的默認搜索引擎,移動端用戶又有相當大的比例不會去修改默認搜索引擎,所以古狗的市占率仍舊穩若泰山。
但就是最近,大米居然和柚子科技合作搞出了什麼柚米os!
讓大米提供源碼,大米卻始終以“未違反ada默認協議”為由,拒不提供。
目前大米公布的ix海外版確實沒有更換默認搜索引擎,瀏覽器引擎仍舊是古狗,但這係統還需要瀏覽器默認搜索引擎嗎?
在大米ix發布後三天,古狗內部就已經開了最高級彆的會議,商議是否對大米啟動直裁程序。
但這種事,就是麻杆打狼兩頭怕。
大米怕被取消gs認證,古狗也怕輿論反噬和禁止後反而讓柚米os堂而皇之的串聯各大手機廠商。
當然,如果有邁國正府的支持和主導,這種直裁風險會小很多。
可因為惡魔島事件,邁國國內的反裘意識高漲,再加上大選在即,這時候上麵基本不可能達成一個一致意見啟動直裁。
裘德背景古狗現在實在投鼠忌器,不敢輕舉妄動,隻能暫時擱置下來,待大選後再全力遊說。
可這樣一來,至少就要半年多的時間。
不,可能還會更長,更可能還會有變數,說不定永遠無法啟動直裁。
比如沃倫當選後,重啟格拉斯斯蒂格爾法案,限製裘德資本的觸角,這是大概率事件。
最重要的是,現在這個巴彆塔的發現太驚人了,謝爾蓋布林完全已經坐不住了,感覺等待的每一分鐘都是在慢性自殺!
所以,必須要在大選結束後第一時間,就能讓當選者開啟直裁調查!
“拉裡,現在搜索數據如何?你認為大選誰獲勝的幾率更大?”
謝爾蓋布林陰沉著臉,掏出ixel手機,在古狗duo上給拉裡佩奇發了一條信息。
“沒有任何懸念,沃倫的搜索量領先那個白癡托馬斯克頓七個百分點。”
沒多久,身在斐濟的拉裡佩奇就給謝爾蓋布林回了一條信息。
沃倫……
謝爾蓋布林臉色陰晴不定。
敏珠派的意識形態很適合互聯網公司,但由於大清洗結束,內部裘德勢力十不存一,反而增加了凝聚力,現在派內反裘意識高漲。
恭賀派倒是對裘德人仍舊友好,無底線的支持伊斯力爾,同時叫囂著對國內反裘的言論與勢力進行報複。
但他們的主張不適合互聯網公司啊!
最關鍵的,還是他們贏不了!
普通人看起來選情異常焦灼的兩派,在擁有最強大數據能力的古狗看來卻洞若觀火。
搜索比差七個百分點,雖然搜索數據和大選結果之間不是完全對應,但七個點的差距,已經足以覆蓋任何誤差!
該死的asf!
如果不是他在un上空搞出的事情,現在古狗完全不會這麼被動!
現在簡直就是在兩個狗屎裡麵選一坨不那麼臭的。
“遊說的怎麼樣了?她是否同意當選後立刻對柚子科技展開調查?”
“我們不能等下去了,既然確定沃倫一定當選,那現在就遊說吧。”
“確保她在當選第二天,就啟動柚子科技的調查!”
競爭,從來都不隻是商業上的較量。