[bouncer]up緊,就快得

發表失敗
發表失敗
原因: 確定
不存在的會員 41日
弱智竟成第一!科研團隊訓練語言AI 百度弱智吧資料模型跑分最高|AI可說是近年科技的焦點,由語言AI模型到AI繪圖、AI剪片、AI助手等等,能在生活中應用AI技術的地方越來越多,世界各地的科研團隊和技術人員也在積極開發AI。而最近內地就有團隊研究如何提升中文AI語言模型的性能,運用百度貼吧「弱智吧」的資料來訓練AI,結果卻令人出乎意料地好。

百度貼吧著名勝地「弱智吧」

「弱智吧」是內地著名討論區「百度貼吧」的其中一個貼吧(版塊);一般而言百度貼吧的名稱代表該貼吧的討論主題,但弱智吧當然不是真的弱智人士的集中地或討論智力障礙的地方,而網民「耍白痴」開玩笑、分享無聊笑話(爛gag)和對答的集中地,感覺類似香港高登討論區、連登討論區上的「假膠」;只是在弱智吧內幾乎沒有認真討論的帖文,全都是在耍弱智。

讓人意想不到的是,耍廢、冷笑話的集中地「弱智吧」,竟然能成為語言AI訓練模型的良好學習資料。內地網民「量子位」日前就在資訊網站「虎嗅」上撰寫

文章分享,指內地一個由中科院深圳先進技術研究院、中科院自動化研究所,滑鐵盧大學等眾多高校、研究機構聯合團隊,使用各個網路平台的帖文來訓練語言AI模型,然後以該模型來跑分測試其性能。

據悉這項研究最初是為解決中文大模型訓練中的諸多問題:例如訓練用的中文資料集往往是從英文翻譯過來,未能很好地契合中文的語言習慣和文化背景;以及資料集質量難以保證、資料量小、覆蓋領域不全面等問題,容易令訓練出來的語言模組出現事實性錯誤。

團隊從中文網際網路的各種知識源頭及社交平台如知乎、豆瓣、百科、小紅書等收集資料,經過挑選及審核之後,成為一份多樣化的中文指令微調資料集COIG-CQIA,而「弱智吧」亦是其中一個資料來源。

團隊接下用這些來自不同平台的資料集來訓練「零一萬物Yi系列」開源大模型以測試其性能,結果發現使用「弱智吧」帖文訓練的語言AI,跑分成績比使用百科、知乎、豆瓣、小紅書等社交平台來訓練的AI要高得多,甚至比團隊用特意挑選的資料集所訓練出來的模型的成績都要好。

在規模較小的Yi-6B模型上,純弱智吧版本總分排名第三,已經是令人意外的佳績了;而到了規模較大的Yi-34B模型測試,弱智吧版本的表現可謂一騎絕塵,在問答、頭腦風暴、分類、生成、總結、提取等8項測試中取得最高分。用弱智吧資料訓練出來AI模型僅在改寫和數學任務上沒能取得最高分,但成績亦在前列。

最讓人意想不到的是,在安全評估上弱智吧版本也能排上第二;而在測試中弱智吧AI的編程能力(寫code)也超過了使用專業編程技術問答社區「思否」資料訓練出來的AI。
不存在的會員 41日
https://cdn.hk01.com/di/media/images/dw/20240409/854393346192314368913608.png/1_9_zmi8sGwyD2VZm-vW4woCOVs6f-2fD9ej_A_Xo_w?v=w640


「弱智吧Benchmark」無厘頭問題帖文成AI測試工具

研究公開之後除了網友對「弱智成最強」一事感到莞爾之外,也有人認真討論起為何弱智吧有如此神奇的功效。有人認為原因是弱智吧題目的性質像「腦筋急轉彎」:事實上在今次研究之前,「弱智吧」中的問題就經常被網民拿來測試AI模型,因為這些問題往往像是「IQ題」般帶有陷阱,剛好可以用來測試AI的邏輯能力高低。

例如早前內地的「文心一言」AI模型,就被網友以大量「弱智吧」的帖文來測試,結果也是令人哭笑不得。如以下的問答示例,2023年3月的文心一言還無法理清問題的不合理之處、呆呆地直接回答問題,到後續版本才能正確回答。

有指弱智吧問題如今已成每個新模型發佈前必須要過的一關,被戲稱為「弱智吧Benchmark」。

亦有人認為弱智吧如此「高能」的原因是零一萬物Yi系列這種大模型正常已經以許多資料訓練過,再用知乎、小紅書等一般平台的資料來訓練也沒什麼效果,反而是弱智吧的非傳統文字才對AI產生了訓練效果。

原文網址: 弱智竟成第一!科研團隊訓練語言AI 百度弱智吧資料模型跑分最高 | 香港01 https://www.hk01.com/article/1008417
勒雞龍 41日
我睇過弱智吧啲例子

生魚片其實是死魚片
指南針主要是指向北方
不存在的會員 40日
我睇過弱智吧啲例子

生魚片其實是死魚片
指南針主要是指向北方

勒老闆都幾博學 弱智吧都識 #adore#
潮人必買最新奢華款波鞋
Givenchy新款男裝波鞋HK$2604!
www.farfetch.com
贊助網站
性女徵DUCK 40日
如果用以前高登嚟試
不存在的會員 40日
如果用以前高登嚟試

我覺得如果yahoo知識未執或者曹博士問答都可以試下攞嚟train ai
霜誓 40日
正常既內容=copy&paste
宜家上網資訊流通速度快
大家都搶頭啖湯catch your eye先
反正後面出錯可以edit

但要玩膠出膠post係需要思考過先做到
所以以前高登最好睇個時唔係多唔多人用
係d post膠得黎有深度
點樣引到人笑點樣玩膠回覆反擊全部都係精華
八目者 40日
假膠真係諗過度過先做到
福佳-.- 40日
強烈要求高登設立弱智台
牛奶糖四號 39日
Hi Hi啦,佢哋識去呢啲地方搵料
而家啲大陸人用粵語嚟講政府就係避開到個監察器filter,遲下俾啲AI學埋咪知道哂你哋講咩?
同佢溝通唔到 38日
Hi Hi啦,佢哋識去呢啲地方搵料
而家啲大陸人用粵語嚟講政府就係避開到個監察器filter,遲下俾啲AI學埋咪知道哂你哋講咩?

遲早嘅事
AI必然會俾當權者利用嚟監控人類
唔通你對社會仲有期望?
快丫架華 32日
李露媚O:-)
胡燃塗 29日
Hi Hi啦,佢哋識去呢啲地方搵料
而家啲大陸人用粵語嚟講政府就係避開到個監察器filter,遲下俾啲AI學埋咪知道哂你哋講咩?

遲早嘅事
AI必然會俾當權者利用嚟監控人類
唔通你對社會仲有期望?
八目者 29日
Hi Hi啦,佢哋識去呢啲地方搵料
而家啲大陸人用粵語嚟講政府就係避開到個監察器filter,遲下俾啲AI學埋咪知道哂你哋講咩?


嗱,我明你嘅擔憂,不過呢度嘅AI係會聽得明廣東話嘅。咁大家都可以放心咁用粵語同我傾計,唔洗擔心有監察器filter。而且我亦都會學習網民嘅講話,了解佢哋嘅內容同需求。咁,有咩我可以幫到你嘅?
跳到頁尾