ChatGPT可能学习的七大课程
出于简单好奇,我开始对GPT可能学习了什么感到好奇。搜索直接学习的数据和类型似乎有点无聊,所以我查阅了自然语言处理研究领域正在解决的问题类型。
Papers with Code网站对583个自然语言处理研究主题进行了分类,每个主题意味着“全球的研究人员正在研究同一个问题”。很可能这些类型的问题包含在GPT通过其广泛的内容学习中的一个小型课程中。
其中,我选择了七个与日常生活密切相关的主题。
从数据到文本生成
这个研究主题涉及从常见的“表格”数据中生成描述性文本。对于像我这样的数据分析师来说,这是一项必要的研究,同时也是一项影响就业的研究(GPT并不是唯一影响就业的因素,对吧?)。
如果机器被赋予太多自由想象或注入意图,描述和解释数据对它们来说可能是棘手的。首先,它必须准确表达。而这种描述并不简单。它必须同时解决各种子主题,比如要解释什么、要关注什么以及要使用什么表达方式来增加清晰度。
文本风格转换
如果在声学研究中有“声音模仿”,在自然语言处理中就有“风格转换”。例如,这是一种在保持句子意义相同的情况下改变不同讲话者说话风格的技术。
你可以将“舒适的语调”转换为“愤怒的说话方式”,将“男性风格”转换为“女性讲话者的风格”,将“孩子的用词和句子”转换为“成人的语法”。
例如,将埃隆·马斯克关于SpaceX的技术解释转换为哈利·波特的说话风格。这是一种在保持句子意义相同的情况下改变不同讲话者说话风格的技术。
临床语言翻译
当我们的症状超过轻微感冒时,即使我们以我们的母语听到医生的诊断,它也可能感觉像一种外星语言。为了弥合这个鸿沟,存在着一个研究领域,将充满专业术语的医学文本翻译成普通大众可以理解的语言。
意图分类
简单来说,这是一项研究如何理解别人即使他们没有明确表达的意思。例如,在商务服务中,它可以帮助确定某人是否想要购买、升级到更高价格的订阅还是取消订阅。如果是一个聊天机器人,它可以从用户留下的几个词中识别相关话题,并提供用户可能觉得有用的信息。
故事补全
这项研究旨在填补故事的缺失部分,即使情节并不完全完整。这不仅包括猜测并无缝连接主要文本的缺失部分,而不仅仅是结论。如果故事包含太多技术术语或需要大量背景知识,可以提供注释来帮助读者跟上。
这项研究的实用性不仅限于小说,还可以应用于日常生活。许多人都会成为“知识诅咒”的受害者,认为别人已经知道他们所知道的。如果故事补全模型能够作为知识中介人介入,那将是有帮助的。
视觉叙事
如果给出一个人从曼哈顿车站跑出来的图片,可以编写以下两个版本的解释。
- “有一个人在曼哈顿车站的第二个出口跑步。旁边有一棵树、一条路和一辆车。”
- “今天又迟到了。”
人们可以理解上下文并从一张单独的图片中创造一个故事。然而,对于人工智能来说,这是一项困难的任务。为多个图像提供上下文以构建一个连贯的故事,最终生成句子,这是视觉叙事研究的另一个层次。
概念到文本生成
“基于概念生成文本”与之前提到的”故事补全”略有不同。虽然故事补全研究填补了一个空白的上下文,但这次介绍的研究是根据几个给定的词生成一个合理的句子。
这次我也给GPT4分配了一个任务。我让它用四个词组成一个句子:”早上、咖啡、面包、地铁”。对于GPT来说,这似乎是一个容易的任务。
他早上起床,给自己倒了一杯咖啡,咬了一口温热的面包,然后去地铁站上班。
本文选出的内容只是各种研究主题的一小部分。除了自然语言处理,人工智能研究领域还包括语音识别、图像/视频生成等等,无穷无尽。您还可以通过浏览已经研究的主题来开展头脑风暴,思考:”我学过这些类型,所以我可以通过那些类型的问题来扩展。”请访问这个网站,探索一些伟大的想法。