# AI及信息技术应用2021年12月27日简报

## 1. 核心定义
> 人工智能语言语义处理是利用自然语言处理技术，使机器能够理解和生成人类语言，实现人机交互的基础。

## 2. 核心洞察 (TL;DR)
- NLP语义分析是AI应用与人交互的基础。
- AI大模型在2021年竞争激烈，参数量不断增长。
- AI技术在图像合成、艺术创作、教育、隐私保护等领域得到应用。
- 联邦学习在保护隐私的同时，实现个性化方法。
- 监管机构对非法内容和数据安全进行严格规范。

## 3. 关键事实与数据
- Megatron LLB Transformer模型由Nvidia开发，基于谷歌早期工作，参数量巨大。
- AI检察官在2015年至2020年间使用17,000多起案件进行训练，准确率达到97%。
- GPT-3拥有1750亿个参数，而DeepMind的Gopher模型有2800亿个参数。
- OpenAI的GLIDE模型在参数量减少的情况下，实现了与DALL-E竞争的性能。
- 万事达卡收购麦当劳的个性化平台Dynamic Yield，以增加服务势头。

## 4. 深度分析正文



AI及信息技术应用2021年12月27日简报
======================

本周在人工智能语言语义处理方向上，有很多年度总结很，NLP语义分析将会是AI应用与人交互的基础，从机器人辩论赛中的反馈到AI大模型的争奇斗艳，对语言、模拟态信息的编码转换成跟人能够交互的语义模型，这个才是大规模应用和渗透的路径，根本上就是人工智能算法是个概率游戏，强悍的算力、精巧的算法、丰富充沛的场景训练数据能在相当高的比例上解决机器自动化执行的问题，但是只要有一点比例的不准确，系统就需要跟人交互，而这个语义转换则是基础，是丰富扩展场景、增强算法应用范围中间件。

**01＃AI应用**

**人工智能机器人在牛津联盟辩论中为自己辩解**

**********************************\[摘要\]：**********************************辩论中使用的 Megatron LLB Transformer由计算机芯片公司 Nvidia 的Applied Deep Research团队开发，并基于谷歌早期的工作。它可以访问大量数据——包括整个维基百科、2016 年至 2019 年的 6300 万篇英文新闻文章，以及价值 38 GB 的 Reddit 公共帖子和评论。它争辩说：“人工智能永远不会有道德。它是一种工具，就像任何工具一样，它被用于好人和坏人。没有'好'人工智能和'坏'人类之类的东西”，阻止此类技术变得过于强大的唯一方法是“根本没有人工智能”。

中国科学家研发出可自行起诉的人工智能“检察官”

**********************************\[摘要\]：**********************************中科院教授石勇和上海浦东检察院团队开发的人工智能检察官可以在台式电脑上运行。对于每个嫌疑人，它会根据从人类生成的案例描述文本中获得的 1,000 个“特征”，其中大部分特征太小或太抽象，对人类来说没有意义。这台机器在 2015 年至 2020 年间使用 17,000 多起案件进行了“训练”。到目前为止，它可以识别和起诉上海最常见的八种犯罪，例如欺诈、赌博、危险驾驶和“寻衅滋事”。“从技术角度来看，97%的准确率可能很高，但总会有出错的可能，”检察官说，由于问题的敏感性而要求不具名。“一旦发生，谁来负责？检察官、机器还是算法的设计者？”

**2021年是AI大模型争奇斗艳的一年**

**********************************\[摘要\]：**********************************GPT-3 拥有 1750 亿个参数，是其前身 GPT-2 的 10 倍。但 GPT-3 与 2021 级相比相形见绌。美国初创公司 AI21 Labs 于 9 月推出的商用大型语言模型 Jurassic-1 以 1780 亿个参数领先 GPT-3。DeepMind 12 月发布的新模型 Gopher 有 2800 亿个参数。威震天-图灵 NLG 有 5300 亿。谷歌的 Switch-Transformer 和 GLaM 模型分别有 1 个和 1.2 万亿个参数。中国华为构建了一个名为盘古的 2000 亿参数语言模型。另一家中国公司浪潮建立了元 1.0，一个 2450 亿参数的模型。百度和深圳研究所鹏程实验室宣布了 PCL-BAIDU Wenxin，这是一个拥有 2800 亿参数的模型，百度已经在各种应用中使用，包括互联网搜索、新闻提要和智能扬声器。而北京人工智能研究院发布了悟道2.0，拥有1.75万亿个参数。与此同时，韩国互联网搜索公司 Naver 宣布了一个名为 HyperCLOVA 的模型，有 2040 亿个参数。

**比 Photoshop 更好：人工智能从文本描述中合成和编辑复杂的图像——它们非常好**

**********************************\[摘要\]：**********************************OpenAI 的计算机科学家首先训练了一个 35 亿参数扩散模型，该模型包含一个文本编码器，以根据自然语言描述来调节图像内容。接下来，他们比较了两种不同的技术，用于将扩散模型引导至文本提示：CLIP 引导和无分类器引导。该研究结合自动评估和人工评估，发现无分类指导可产生最高质量的图像。

**这款 AI 驱动的艺术应用程序可让您用文字绘画**

**********************************\[摘要\]：**********************************Wombo 是一家加拿大初创公司，因其同名的支持 AI 的口型同步视频应用程序而吸引了早期的眼球，最近推出了另一个名为Dream的应用程序，该应用程序使用 AI 来创建基于文本提示的原创“艺术品”。Dream 应用程序的“艺术”质量绝对是可变的。更长、更复杂的提示似乎让它感到困惑。因此，输出的质量取决于您要求它绘制的内容。而它的“风格”，如果可以被认为是在如此多的拼凑中具有单一的总体风格，则更倾向于抽象和扭曲，而不是具体和精确。因此，肖像请求将不会呈现真实感。描绘幻想通常比描绘真实更舒服。

**NLP是智能企业的心脏**

**********************************\[摘要\]：**********************************NLP 的吸引力主要在于其消化大量非结构化数据的能力，长期以来人们怀疑这些数据包含关键信息和隐藏数据模式，如果利用得当，这些数据可以为业务发展、生产力和竞争力创造奇迹。Service Express 数据科学经理Jim Carson最近在 Data Center Frontier 上指出，NLP 基本上填补了计算机理解和人类理解之间的空白。这可以显着改进广泛的企业流程，例如电子邮件管理和合同分析，以及设备日志记录和数据中心基础设施监控。

停止创造自我实现的预言：如何将人工智能应用于小数据问题

**********************************\[摘要\]：**********************************在 B2B 的世界，我们仍然面临数据短缺的问题，主要是因为与 B2C 相比，交易数量要少得多。因此，为了让AI 兑现其革新企业的承诺，它还必须能够解决这些小数据问题，许多数据科学家转向不良实践，创造自我实现的预言，这降低了人工智能在小数据场景中的有效性——并最终阻碍了人工智能在推动企业发展方面的影响。

OpenAI 发布 GLIDE：可与 DALL-E 性能匹敌的缩小文本到图像模型

**********************************\[摘要\]：**********************************OpenAI研究人员本周提出了GLIDE，这是一种扩散模型，在使用不到三分之一的参数的情况下实现了与DALL-E竞争的性能。CLIP (Radford et al., 2021) 是一种用于学习文本和图像之间的联合表示的可扩展方法，它提供反映图像与标题的接近程度的分数。该团队通过用“指导”模型的 CLIP 模型替换分类器，将这种方法应用于他们的扩散模型。

万事达卡收购麦当劳尖端个性化平台 Dynamic Yield 以增加服务势头

**********************************\[摘要\]：**********************************麦当劳将AI 和技术公司 Dynamic Yield 出售给万事达卡，金额未公开。Dynamic 使用数据和机器学习来帮助企业为其客户量身定制服务和数字促销。麦当劳将继续使用其技术来推荐产品，大概是在其免下车和售货亭。该公司的 SaaS 平台考虑了一天中的时间和页面浏览量等因素，为零售、银行、旅游和其他行业的客户提供个性化的产品推荐。万事达卡表示，此次收购将使 Dynamic 能够将其技术扩展到其他业务。

Edge Impulse 宣布 B 轮融资，为各地的开发人员和企业扩展 Edge ML

**********************************\[摘要\]：**********************************自 2019 年推出以来，来自数千家企业的近 30,000 名开发人员使用 Edge Impulse 创建了超过 50,000 个定制 ML 项目，与包括 Oura、Polycom、Advantech 和 NASA 在内的客户一起构建更智能的工业、物流、消费者和健康解决方案。

**DeepMind 用 2800 亿参数模型测试大型 AI 语言系统的极限**

**********************************\[摘要\]：**********************************DeepMind 定期将其工作提供给 Google 产品，它通过构建一个名为 Gopher 的具有 2800 亿个参数的语言模型来探索这种 LLM 的功能。参数是一种语言模型大小和复杂性的快速衡量标准，这意味着 Gopher 比OpenAI 的 GPT-3（1750 亿个参数）大，但不如一些更具实验性的系统，如 Microsoft 和 Nvidia 的Megatron 模型（5300 亿个参数）。在 AI 世界中，越大越好，这通常是正确的，更大的模型通常提供更高的性能。DeepMind 的研究证实了这一趋势，并表明在最常见的基准测试（如情感分析和总结）上，扩大法学硕士确实可以提高性能。然而，研究人员还警告说，语言模型固有的一些问题需要的不仅仅是数据和计算来解决。

Airtable 收购 Walrus.ai 的创始团队

**********************************\[摘要\]：**********************************Airtable 今天宣布，它悄悄收购了无代码软件测试平台 Walrus.ai。Walrus 团队旨在通过帮助用户用简单的英语编写测试来更轻松地构建端到端软件测试，Airtable 希望将其所有用户转变为应用程序开发人员。

仅需几天，简约神经网络更快地发现物理定律

**********************************\[摘要\]：**********************************研究人员提出了能够从数据中学习可解释物理模型的简约神经网络；重要的是，它们可以提取当前问题的潜在对称性，并提供物理洞察力。这是通过平衡精度与简约来实现的，可调节参数用于控制这两项的相对重要性并生成一系列帕累托最优模型。

**本月登陆淘宝天猫！这个虚拟人“AI Wendy”想要挑战真人导购员**

**********************************\[摘要\]：**********************************AI Wendy用户实际交互界面示意图某一天，当小亿再次打开天猫的时候，她忐忑地点入一家店铺，当然无法抉择该点什么地方时，屏幕上立刻浮现出一名可亲的导购小姐——由3D技术构成一颦一笑的智能导购小姐“AI Wendy”，她拿出一面“魔镜”，经过小亿同意，这面魔镜通过手机摄像头拍照并扫描了小亿的面部特征，并立刻从软件云端所拥有的数据库中调取了相关面部知识图谱与美妆知识图谱。“AI Wendy”的创造者美美到家CEO曾莞晴告诉亿邦，在今年12月底，天猫商城、淘宝的美妆类卖家，均可开始使用Wendy充当店内的“虚拟导购员”，优化顾客在店内的产品选购体验。

**02＃产品市场创新**

Ed-Tech 初创公司 iNeuron 推出首个用于教育的 OTT 平台“OneNeuron”，解锁按需服务

**********************************\[摘要\]：**********************************iNeuron是一家知名的教育科技初创公司，由两位志同道合的专业人士Sudhanshu Kumar 和 Krish Naik于 2019 年开始运营。整个目的是以可承受的价格提供高质量的高科技课程。该计划经过精心构建，并包含学习、实际项目、作业和工作准备模块。“该平台的最佳功能是“按需教育服务”，并声称您询问任何存在的技术，我们会在 60 天内提供其学习模块。这些激动人心的课程与项目、工作准备和按需服务相结合，每年只需支付6000 印度卢比 + 消费税，最低且负担得起。捆绑 100 多门课程的费用不会超过每门课程 60 印度卢比，但与此相关的上述世界一流服务是无价的。

**2021 年的 DuckDuckGo：打造隐私超级应用**

**********************************\[摘要\]：**********************************据首席执行官加布里埃尔温伯格称，以隐私为中心的搜索引擎 DuckDuckGo 正在开发一种“日常”桌面浏览器。在一篇博客文章中，温伯格表示，该公司正在使用操作系统提供的渲染引擎而不是 Chromium（支持 Google Chrome、Microsoft Edge 和其他浏览器的浏览器代码库）“从头开始”构建桌面应用程序。

**03＃监管与合规**

关于阿里log4j2漏洞上报问题，给阿里说句公道话

**********************************\[摘要\]：**********************************阿里适用的是第10条 鼓励发现网络产品安全漏洞的组织或者个人向工业和信息化部网络安全威胁和漏洞信息共享平台、国家网络与信息安全信息通报中心漏洞平台、国家计算机网络应急技术处理协调中心漏洞平台、中国信息安全测评中心漏洞库报送网络产品安全漏洞信息。我不知道阿里公司到底为什么会犯这种错，我个人的猜测是，阿里由于部门之间的沟通问题，导致阿里这个员工可能压根不知道中国新出了这么个规定和平台，和中国99%的开发人员一样。以根据这个规定，其实并不能对阿里进行处罚。但问题是在log4j2这个事情里，阿里并不是该网络产品的提供者，这个产品提供者是apache组织，阿里只能算作网络运营者。对阿里进行处罚实际是因为它同时是工信部网络安全威胁信息共享平台合作单位。

**联邦重建：部分本地联邦学习**

************************************\[摘要\]：************************************联邦学习中的个性化方法旨在平衡联邦和本地培训在数据可用性、通信成本和对客户端异构性的稳健性方面的好处。由于隐私和通信限制，要求客户端传达所有模型参数的方法可能是不可取的。其他方法需要始终可用或有状态的客户端，这在大规模跨设备设置中是不切实际的。我们介绍了联邦重建，这是第一个适用于大规模训练和推理的部分局部联邦学习的模型不可知框架。我们通过与模型无关的元学习的连接来激励框架，凭经验证明其优于现有的协同过滤和下一个词预测方法的性能，并发布了一个开源库，用于评估这种设置中的方法。我们还描述了这种方法在移动键盘应用程序中的联合协作过滤的大规模成功部署。

谷歌因违反该国的非法内容删除规范而被俄罗斯法院罚款 9840 万美元（7.2 卢布）

**********************************\[摘要\]：**********************************俄罗斯当局裁定，这家搜索引擎公司未能删除宣传吸毒、自制武器和极端主义恐怖组织的帖子，俄罗斯法院罚款 9840 万美元（7.2 卢布），据报道，这是俄罗斯一家外国科技公司因此类违规行为而被处以的最高罚款。批评人士认为，俄罗斯正在该国实施更严格的内容控制，威胁到个人在互联网上的言论自由。路透社计算出，罚款相当于谷歌俄罗斯年营业额的 8% 左右。

证监会就境外上市相关制度规则公开征求意见 满足合规要求的VIE架构企业备案后可以赴境外上市

**********************************\[摘要\]：**********************************上证报中国证券网讯 据证监会12月24日消息，为促进企业利用境外资本市场规范健康发展，支持企业依法合规赴境外上市，根据《中华人民共和国证券法》，证监会会同国务院有关部门对《国务院关于股份有限公司境外募集股份及上市的特别规定》提出了修订建议，研究起草了《国务院关于境内企业境外发行证券和上市的管理规定》，并同步起草了《境内企业境外发行证券和上市备案管理办法》，作为《管理规定》的配套规则，现一并向社会公开开征求意见。

---
## 5. 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://www.haxitag.com/briefs/ai-brief-20211227-ai20211227](https://www.haxitag.com/briefs/ai-brief-20211227-ai20211227)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。
