搜尋條件

service@dcc.com.tw +886-2-7752-2800

大連新訊

【繁中專家語言模型開源計畫 Project TAME 發起者】大連化工董事長林顯東:集團的 AI 藍圖,就是建立涵蓋企業五大機能「產銷人發財」的戰情分析室

2024.07.03

由長春集團、和碩聯合科技、長庚醫院、欣興電子、科技報橘聯合發起,與台大資工系、台大資管系及律果科技合作,在 NVIDIA 技術支持下訓練的「繁體中文專家模型開源專案 TAiwan Mixture of Experts(後簡稱 Project TAME )」,已正式對外發布,將以 Open Source 開放原始碼的形式,創造台灣的 AI 應用生態系。大連化工董事長林顯東特別接受科技報橘社長戴季全的專訪,從企業經營者的角度分享加入 Project TAME 的契機。

林顯東董事長訪問影片及照片:


「對岸整個石化業的發展,正以歷史上沒有見過的速度快速擴張,」林顯東表示,台灣可能花三十年才能推進 100 萬噸的產能,中國在兩三年間就直接超車達到 200 萬噸,因此長春集團更需要懂得應用 AI 預測分析,更快得知獲利、產品競爭上可能出現的風險,「最近我們做 Project TAME,才知道原來還可以建立一個很有效的大型資料庫。」

長春集團發展石化產業將近 70 年,留下非常多高價值、以繁體中文記錄的資料,包括集團各公司的經營與投資方向,還有工廠管理、工業安全管理等重要資料,因此現階段以最熟悉的石化工業、生產事業資料來訓練繁體中文專家模型 Project TAME。林顯東指出,長春集團的 AI 藍圖為建立涵蓋企業五大機能「產銷人發財」的戰情分析室,並利用 AI 輔助決策,例如在算力的部分,可以進行銷售分析,「我們發現它算力的速度幾乎是傳統的萬倍,比如說我們可以在一秒內就選出這個月的十大客戶。」

林顯東認為應用繁體中文專家模型 Project TAME ,特別厲害的地方就是做文字與圖像分析,「以前我們必須要藉由參謀人員去做分析,AI 卻能夠用文字做出各種譬如獲利的分析、產能的分析。在做圖像方面, AI 做的 Dashboard 分析用圖像,能夠做到非常的精細,這對於高階管理人員來講,非常具有視覺上的參考性。」

應用繁體中文專家模型 Project TAME,還有一個非常重要的特色就是預測。「預測其實是非常難的,因為預測有很多思考的不同要件會發生,」林顯東表示,以前做預測常會仰賴經營者的直覺、歷史經驗,或者是由參謀人員、高階管理人員直接提出預測,「我們分析產品價格會漲或會跌,會做很多顯像,例如原油價格的分析,或是原油價格的資料,現在 AI 能讓做預測的人來選這些資料,不同的人思考的角度不同,他會選不同的要項,我們就可以很快的看到這個分析,譬如說做三個月、六個月的分析,這個預測其實在經營管理上面,是一個非常重要的工具。」

林顯東認為,「參加這個 Project TAME 是一個好的開始,它還有很多、很大潛在發展的空間。」他期待有一天能夠建立自己的石化專業專家模型,並與國外的專家模型合作,「例如在一樣的工業安全領域,其他國家是怎麼做的,我們是怎麼做的,能夠互相的比較、學習,所以未來國際專家模型的合作將是一個很大的市場。除了互相學習之外,我們也可以輸出專家模型,透過專家模型協助剛開始發展這些工業的國家,這是很有意義的事。」

台灣發展繁體中文語言模型,是「保存一個文明」

當進一步談到「台灣需不需要建立一個屬於自己的主權 AI——繁體中文語言模型?」林顯東深度分析,主權分為政治、文化、娛樂的面向,例如美國強勢的好萊塢風格影響全世界娛樂產業深遠,擁有娛樂主權,但未來將可能導致多樣性的缺乏。林顯東認為 Project TAME 這項計畫從宏觀面來看,就是在保存繁體字的文明,如果追溯繁體字的歷史有三、四千年,目前地球上約有六千萬人使用繁體字,「你如果站在一個高度來看,六千萬人其實背負著幾千年的東西,這就值得我們去做它一次。」

林顯東強調,Project TAME 不只是單純訓練語言模型,還是一個轉捩點、一個歷史上的事件正在發生,「我們跟學校、業界一起來做這件事情,雖然感覺我們正在做資訊的事情,但其實那不只是資訊,我們正在保存一個文明、發展一個文明。」

(責任編輯:曾品潔)


延伸閱讀:

經濟日報:長春、和碩、長庚、欣興攜手新創 建立繁體中文專家模型

https://money.udn.com/money/story/5612/8065239

2024/07/01 09:51:29

經濟日報 記者彭慧明/即時報導

本土語言AI、專業領域AI受到各國政府與產業的重視。長春集團、和碩聯合科技、長庚醫院、欣興電子、科技報橘聯合發起,與台大資工系、台大資管系及律果科技合作,在 NVIDIA 支持下訓練的「繁體中文專家模型開源專案 TAiwan Mixture of Experts(Project TAME )」今天正式發表,是全球首創重量級多產業共同孕育的繁中大型語言專家模型,未來 Project TAME以Open Source 開放原始碼的形式,邀請產業一同加入、共創「台灣產業專用 AI 應用生態系」。

Project TAME 繁中專家模型開源計畫,由台大資工系副教授陳縕儂帶領實驗室同仁與企業夥伴開發團隊共同合作,使用 NVIDIA開發者計畫技術支持,讓多家垂直產業的企業專家貢獻專業領域的資料,預訓練近5千億個字(token)開發出繁中大型語言專家模型。包括長春集團、和碩聯合科技、欣興電子、長庚醫院、科技報橘、律果科技即為石化工業、電子製造、醫療服務、內容服務、法律等各產業代表,成為首批聯合投入 Project TAME 繁體中文模型訓練的業界專家角色。

Project TAME 繁體中文模型已有初步具體顯著成果,在各項繁中相關指標中領先全球模型,連台灣的「大學學測、律師/中醫考試、導遊證照、駕照、台灣在地化測驗」都分數優異,在台39項綜合評測,近三千個題目,Project TAME 分數就超過所有模型,正確率相較第二名的 Claude-Opus 模型高了6.8%,比 GPT-4o 甚至高了9.3%。

長春集團(大連)董事長林顯東談到決定參與 Project TAME ,在於他觀察到中國石化業正以前所未有的速度擴張,台灣可能花三十年才能推進100萬噸的產能,中國大陸在兩三年間就直接超車達到200 萬噸,因此長春集團更需要懂得應用 AI 預測分析,更快得知獲利、產品競爭上可能出現的風險。林顯東指出,長春集團的 AI 藍圖為建立涵蓋企業五大機能「產銷人發財」的戰情分析室。

和碩聯合科技指出,參與 Project TAME,希望透過開放式聯盟的創新合作方式,結合各產業領域的專家資料,以及學界大型語言模型的專業,加速產業生成式AI的應用,實現AI落地的場景。

林口長庚醫院院長陳建宗表示,將 AI 繁中大型語言模型導入醫療第一線,醫師只要在病歷上搜尋資料,就會彈出視窗顯示,以前沒有那麼方便,現在整合所有資料,又符合醫師作業習慣。

欣興電子參與 Project TAME,除了合作建立公開的繁體中文專家模型,也將透過公司內部資料庫,調校成內部專用的產業專家模型,預期在未來可為專業知識問答,提供更符合公司內部作法的準確建議,提升工作效率。

科技報橘已使用未經過繁中優化的大型語言模型推出測試的內容產製,在官網上的 AI 人機協作專區已可看到,但這一年的實驗顯示,勢必需要有繁中優化的大型語言模型才能更好服務社群用戶。

法律科技新創公司律果科技表示,法律內容有很強的在地化需求,因此協助 Project TAME 加入台灣法律語料進行訓練。台大資工系將目前各大型語言模型試用在台灣律師考試題目上,Project TAME 分數均超過所有其他模型。

繁體中文專家模型 Project TAME 正式對外發布後,將採用 Open Source 開放原始碼的形式,讓各產業企業有一個 Hub 中心可以進行合作。台大資工系副教授陳縕儂指出,在不同的資料間可能有共同交集可以使用, 這對語言模型的發展是更好的,也能讓不同產業的專家貢獻自己領域的資料。目前已開放各企業皆可免費下載使用「繁體中文專家模型 Project TAME」(https://github.com/MiuLab/Taiwan-LLM)、模型聊天頁面(https://www.twllm.com)、以及由亞太智能機器(APMIC)率先整合 Project TAME,提供聊天機器人測試頁(http://techorange.com/tame)。