是我创造了首个 LLM:Kaggle 前首席科学家一句话引发 AI 学术圈考古行动

2025-04-09 15:01:00 麦德手游站

论如何在技术圈争论中一句话噎到对方:

哥们,是我创造了第一个大语言模型。

发言者 Jeremy Howard 为澳大利亚昆士兰大学名誉教授、曾任 Kaggle 创始总裁和首席科学家,现 answer.ai 与 fast.ai 创始人。

事情的起因是有人质疑他最近的项目 llms.txt 在帮助大模型爬取互联网信息上并没太大作用,从而引发了这段争论,迅速引起众人围观。

闻讯而来的“赛博考古学家们”一番考据之后,发现第一个大语言模型这个说法还真有理有据:

2018 年初,Jeremy Howard 发表的论文 ULMFiT,使用非监督预训练-微调范式达到当时 NLP 领域的 SOTA。

甚至 GPT-1 的一作 Alec Radford,在发表 GPT-1 时也公开承认过 ULMFiT 是灵感来源之一。

有人搬出综述论文,指出从“遗传学”视角看,ULMFiT 是所有现代大模型“最后的共同祖先”。

还有好事者软件工程师 Jonathon Belotti,专门写了一篇完整考据《谁才是第一个大语言模型》

大语言模型起源考据

首先来介绍一下 ULMFiT 这篇论文,入选 ACL 2018:

提出有效迁移学习方法,可应用于 NLP 领域的任何任务,并介绍了微调语言模型的关键技术,在六个文本分类任务上的表现明显优于当时的 SOTA 方法,在大多数数据集上将错误率降低了 18-24%。此外,仅使用 100 个带标签的示例,它的性能就与在 100 倍以上数据上从头开始训练的模型性能相当。

那么 ULMFit 算不算第一个大语言模型呢?Jonathon Belotti 考据遵循这样的思路:

首先找一个大家都公认肯定算大语言模型的成果,GPT-1 肯定符合这个标准。

再从 GPT-1 和后续 GPT-2、GPT-3 中提取一个模型成为成为大语言模型的标准:

omofun动漫app正版下载
omofun动漫app正版下载
休闲益智 / 9.9MB
2025-04-09
详情
picacg哔咔官网版
picacg哔咔官网版
休闲益智 / 9.9MB
2025-04-09
详情
omofun官方版入口
omofun官方版入口
休闲益智 / 9.9MB
2025-04-09
详情
次元城动漫app正版
次元城动漫app正版
休闲益智 / 9.9MB
2025-04-09
详情
囧次元无广告版下载安装2025
囧次元无广告版下载安装2025
休闲益智 / 9.9MB
2025-04-09
详情
one一个手托奶图标安卓版
one一个手托奶图标安卓版
休闲益智 / 9.9MB
2025-01-15
详情
omofun动漫app免费下载安卓正版
omofun动漫app免费下载安卓正版
休闲益智 / 9.9MB
2025-03-26
详情
漫蛙manwa2正版下载.apk
漫蛙manwa2正版下载.apk
休闲益智 / 9.9MB
2025-01-25
详情
魅影直播5.3最新版特色下载
魅影直播5.3最新版特色下载
休闲益智 / 9.9MB
2024-12-26
详情
acfan流鼻血污染版
acfan流鼻血污染版
休闲益智 / 9.9MB
2025-01-09
详情

相关麦德下载

漫蛙manwa2正版下载.apk
漫蛙manwa2正版下载.apk
休闲益智 / 9.9MB
详情
acfan流鼻血污染版
acfan流鼻血污染版
休闲益智 / 9.9MB
详情

推荐麦德攻略

最新麦德攻略