谷歌搜索的灵魂！BERT模型的崛起与荣耀( 三 ) 智东西（公众号：zhidxcom）作者|子佩

在BERT逐渐发挥影响力、实现应用落地的同时， NLP届的新秀也轮番亮相。
2019年出现的XLNet和2020年出现的GPT-3就是杀出重围的两员大将。
XLNet ，在BERT的基础上，加入了自回归的预训练方法，得到一个既擅长语义理解也擅长语义生成的模型，补齐了BERT模型在长文阅读、以及文字生成方面的短板。
而GPT-3更是来势汹汹，作为OpenAI旗下第三代深度语言学习模型，它自带1705亿个参数，是前一代模型GPT-2的100倍，经过5000亿个单词的预训练，在无微调的情况下，取得多个NLP基准测试上的最高分数。
文章插图
与此同时， GPT-3也解决了BERT模型存在的两个问题：对标注数据的依赖，以及对训练数据集的过拟合，旨在成为更通用的NLP模型。
基于更大的数据集和更多的参数， GPT-3不仅能搜索网页，还能答题、聊天、写小说、写曲谱，甚至还能自动编程。
在目前的调试阶段， GPT-3也暴露出了包括仇恨言论、错误信息等许多问题，所以纵使顶着NLP界最强后浪的名号，它目前暂时还无法像前辈BERT一样，落地应用，为人类带来价值。
结语：NLP新时代， BERT不缺席自然语言处理（NLP）领域有很多细分方向：文本分类、机器翻译、阅读理解、机器人聊天……每一个子题都对应着人工智能在现实生活中的实际应用：网页检索、自动推荐、智能客服……
如何让人工智能真正走入我们的生活，第一个要解决的问题就是如何让机器真正地理解我们想要什么。
BERT让我们迈出了一大步，基于自监督学习处理无标记数据，再通过双向编码理解文义， BERT打破了之前训练数据需要标记的“魔咒” ，充分利用了大量无标记文本，是NLP届里程碑式的革新。
从诞生、进阶到衍生出一系列语言模型，已经两岁的BERT用时间证明了自己的巨大潜力，或许在未来，它将融合进新的应用，为我们带来意想不到的AI革命。
【谷歌搜索的灵魂！BERT模型的崛起与荣耀】参考资料：谷歌AI blog、Rock Content、searchengineland
文章插图