前往
大廳

主題

大型語言模型LLM演化樹及實踐指南

這可不是鬧著玩的 | 2023-04-28 22:36:13 | 巴幣 2012 | 人氣 643

更新日期：2024/04/08

來自亞馬遜、德州農工大學、萊斯大學的學者們所研究及調查。

Paper:

https://arxiv.org/abs/2304.13712

Github(作者已有一段時間尚未更新):

https://github.com/Mooler0410/LLMsPracticalGuide

Twitter:

https://twitter.com/ylecun/status/1651762787373428736

LLM演化樹(因作者已有一段時間尚未更新，許多模型尚未新增上去，例如Gemini、Claude 3等)：

非灰色：基於Transformer模型
粉紅色分支：純encoder(編碼器)的模型
綠色分支：encoder-decoder(編-解碼器)的模型
藍色分支：純decoder(解碼器)的模型
實心：Open source，表示開源的模型，例如LLaMA(被迫)
空心：Closed source，表示閉源的模型，例如ChatGPT
右下的堆疊長條圖：不同公司與機構的模型數量

決策流程圖：幫助使用者評估下游NLP任務該選擇LLMs還是微調模型(Fine-tuned models)

Y：符合條件
N：不符合條件
Y旁邊有黃色圓圈：表示目前尚未有合適的模型

4

送禮物贊助創作者 !

0

創作回應

看不懂，但是好厲害的感覺

2023-04-28 23:58:12

這可不是鬧著玩的

總結並分類了歷代的LLM發展，並且幫使用者可以針對他們的NLP應用判斷合適的模型
https://truth.bahamut.com.tw/s01/202301/ec7b15e113a021e6e5f0074446393436.GIF

2023-04-29 02:40:31

伊(熊頭模式爆發中

安安，在下想問個問題

我想做一個聊天機器人，希望他是像character.ai那種，屬於有限知識的、像真人聊天的(可以談情說愛www)，而非chatGPT那類智能助理。

目前character.ai沒有api，而且我也想在local部屬，目前我手上有的也只有一張3080Ti，要跑LLM似乎很難，倒是有看過gpt4all比較好跑。

不知道大大有沒有啥建議?

2023-05-02 16:55:10

這可不是鬧著玩的 a35963596

追蹤創作集

作者相關創作

作品資料夾

大型語言模型LLM演化樹及實踐指南

Meta推出LLaMA 3模型，分別有80億、700億參數，而最大的4000億參數量模型正在訓練當中！

國科會推出TAIDE-LX-7B模型(已推出基於Llama 3的新版本)

Claude 3：繼Claude 2後的下一代新模型，碾壓GPT-4、Gemini Ultra等模型

Google推出Gemini Pro 1.5版，OpenAI推出影片生成模型Sora，以及...

Google Bard改名為Gemini，並釋出搭載Gemini Ultra 1.0模型的付費版Gemini Advanced服務以及專屬App

FunSearch：DeepMind所推出，能在數學、科學等新舊問題上找到更好最佳解的新技術

3D Gaussian Splatting的JS庫gsplat.js現在支援動態3D場景渲染

Magika: Google開源基於AI的檔案辨識工具，擁有99%以上的辨識率、毫秒級的速度...

Gemini: 由Google所推出的多模態AI大模型

OpenAI DevDay首屆開發者大會: 釋出GPT-4 Turbo新模型、多種AI應用

DragGAN: AI圖像編輯器，可隨意拖動改變對象的姿勢、形狀、表情、佈局等

全球資訊網(WWW)今年35歲了

聖誕樹星團NGC2264

A Place In My Heart feat. moumoon - 聽了會讓人十分溫暖又振奮人心的歌

The Crane Wives — Curses

兩個交集的世界...

相關創作

CohereForAI Command R+ (ChatGPT以外的選擇)

2

170

達人【論文導讀】別再「濫」學了！從實作面反推AI的概念與道理

%%鼠拒收病婿

31

1100

~*論以仿生人作為伴侶的可行性與相關哲學暨社會問題雜談 (上)*~

~*姬宮詳子*~

3

528

0

0

追尋青春追尋你

0

0

給你的一則訊息

0

0

願世界的殘酷從此消殆 | 不復來

0

0

[好書推薦]《AI工具使用手冊》魔法書

0

0

愛的慈悲 - 暗夜

0

0

棋類遊戲與上下文推理的關係

1

160

ChatGPT新功能

0

0

卷中江河歲月

0

0

0

21

故人花難續緣

0

36

亂七八糟 RRR

0

0

[AI tutorial] 如何做風格類似的圖片 | 似顏繪

0

0

0

27

嫩嫩上班族

6

33

諸神之劍斷命運

0

33

關於達人專欄

4

37

更多創作

這可不是鬧著玩的 a35963596

追蹤創作集

其他創作

作品資料夾