# AI及信息技术应用2022年1月4日简报

## 核心定义
> 人工智能是一种模拟人类智能行为的技术，通过机器学习、深度学习等方法，使计算机能够执行复杂任务，如图像识别、自然语言处理等。

## 核心洞察（TL;DR）
- 2021年在线讨论最多的技术是人工智能，讨论文章数量达到175,837篇。
- 微软发布了下一代Conversational Language Understanding客户端库，提供性能显著提升的语言服务。
- 加州大学伯克利分校研究人员推出无监督强化学习基准（URLB），为无监督RL算法提供定义的评估过程和优化。

## 关键事实与数据
- 关键事实1: 2021年在线讨论最多的技术是人工智能，讨论文章数量达到175,837篇。
- 关键事实2: 微软的Conversational Language Understanding客户端库使用多语言Transformer模型，性能较现有服务提升显著。
- 关键事实3: 加州大学伯克利分校的无监督强化学习基准（URLB）为无监督RL算法提供了定义的评估过程和优化，有助于比较不同算法。

## 正文
# AI及信息技术应用2022年1月4日简报
====================

在2021年在线讨论最多的内容是人工智能，很多行业、场景和体验，都开始引入AI能力提供的更好的体验。本周的GoogleAI听音乐就可以转译出曲谱、乐器，实现从音乐到音符，这是很有趣。跟阅粒的想做的事情一样，如果算法听一遍自己写出来、并进行改进优化，这算侵权的吗？著作权怎么处理？

**01＃AI应用**

**人工智能是 2021年讨论最多的技术**

************************************\[摘要\]：************************************Walkme.com 使用分析工具 Buzzsumo 的数据编制了一份 2021 年在线讨论最多的技术列表，其中人工智能以 175,837 篇在线文章位居榜首。

微软推出下一代会话语言理解客户端库

**********************************\[摘要\]：**********************************微软发布了下一代 Conversational Language Understanding 客户端库，允许开发者使用 Azure Cloud Conversational Language Understanding 服务来训练模型并在应用程序中使用，以提供相关的语言服务。开发人员可以使用 .NET 或 Python，这些库目前处于 beta 开发阶段。语言认知服务使用多语言 Transformer 模型。据官方称，与现有的语言理解服务相比，开发人员会注意到性能的显着提升。

芝加哥大学和特拉维夫大学的研究人员推出了“Text2Mesh”：一种根据文本目标改变 3D 网格的颜色和几何形状的新框架

**********************************\[摘要\]：**********************************Text2Mesh 使用“神经样式字段”作为“神经先验”，利用其归纳偏差（即神经网络倾向于“假设”呈现给它的每个样本都表现出用于训练的样本共有的特征）使结果远离 CLIP 嵌入空间中存在的退化解决方案（由于图像与文本关联中的许多误报）。可以被认为是低维的顶点（因为它们由 3D 向量表示），被馈送到多层感知器 (MLP) 以学习神经样式字段（充当从顶点到颜色和沿法线方向的位移）。在网格具有尖锐边缘或非常详细的 3D 特征的情况下，这会导致谱 偏差的发生，即浅层网络无法学习复杂或高频函数的趋势。Text2Mesh 通过使用基于傅立叶特征映射的位置编码克服了这个问题。

加州大学伯克利分校研究人员推出无监督强化学习基准 (URLB)

**********************************\[摘要\]：**********************************机器人学习实验室 (RLL) 的一组研究人员一直致力于使无监督强化学习 (RL) 成为开发可泛化 RL 代理的可行选择。为此，他们使用开源 PyTorch 代码为 8 个领先或流行的基线创建并发布了一个无监督的 RL 基准测试。近年来已经提出了几种无监督的 RL 算法。但由于评估、环境、优化等方面的差异，一直无法客观比较。因此，该团队推出了URLB（无监督强化学习基准）工具，该工具可为无监督 RL 算法提供定义的评估过程、域、下游任务和优化。

**这款 AI 驱动的艺术应用程序可让您用文字绘画**

**********************************\[摘要\]：**********************************加拿大初创公司 Wombo.ai 最近发布了适用于iOS和Android的应用程序Dream ，它让用户只需输入文本提示并选择视觉风格即可创作原创“艺术品”。该应用程序由 2021 年出现的人工智能技术提供支持， OpenAI DALL-E 在 1 月初展示。

机器学习程序连接到人脑并指挥机器人

**********************************\[摘要\]：**********************************研究人员开发了一种机器学习程序和脑机接口，使患者能够用他们的思想控制机械臂的运动。概念验证可以让机器人为四肢瘫痪患者执行任务，并最终用于控制轮椅。该系统使用逆向强化学习（一种基于从人类行为中提取奖励的人工智能框架）来确定和学习患者希望机器人做什么。一个算法连接到一个脑电图头帽，扫描一个人的大脑活动。当机器人出错时，患者的大脑会发出一个“错误信号”，并在扫描中解码。这告诉机器人任务是错误的。错误信息被输入算法，机器人通过不同的动作，通常是 3-5 个新动作，在试错过程中确定哪个动作是正确的，随着时间的推移不断学习。

认知服务和NVIDIA AI提升Microsoft Teams实时字幕和转录功能

**********************************\[摘要\]：**********************************Microsoft Teams 是全球沟通和协作的重要工具，每月有近2.5亿活跃用户。Microsoft Azure 认知服务为Teams提供28种语言的字幕和转录，并将很快能够在NVIDIA GPU上运行关键的计算密集型神经网络推理。实时字幕功能帮助与会者实时跟踪对话，转录功能方便与会者在日后回顾当时的创意或回看未能参与的会议。NVIDIA Triton开源推理服务软件能够帮助Teams使用认知服务优化语音识别模型。

**谷歌推出全能扒谱AI：只要听一遍歌曲，钢琴小提琴的乐谱全有了**

**********************************\[摘要\]：**********************************这就不是人类音乐大师，而是谷歌推出的“多任务多音轨”音乐转音符模型MT3。因此，作者受到低资源NLP任务迁移学习的启发，证明了通用Transformer模型可以执行多任务 AMT，并显著提高了低资源乐器的性能。多音轨的自动音乐转录数据集更是“低资源”的。

**iMEDISYNC 在 2022 年国际消费电子展上推出全球首款集成无线脑 EEG**

**********************************\[摘要\]：**********************************韩国领先 AI 驱动早期检测和治疗平台 iMediSync 宣布，该公司将展示其全面的脑电图解决方案（硬件 + 软件 + 远程远程医疗解决方案） , 在短短 10 分钟内对潜在的心理状况进行大脑心理健康筛查和预测分析。他们在 2022 年拉斯维加斯国际消费电子展上推出他们的第一款治疗设备——iSyncWave™，它集成了 EEG 大脑映射和 LED 疗法，由AI深度学习算法操作的EEG（脑电波）和HRV（心率变异性）的完整分析报告，以评估大脑和功能障碍的状况，包括早期诊断见解。

**前 SpaceX 工程师推出可在 5 分钟内制作和烘焙的机器人比萨店**

**********************************\[摘要\]：**********************************Stellar Pizza 是由三位前 SpaceX 工程师推出的新型披萨制作机器人。比萨店可以在不到五分钟的时间内制作、烘烤和制作比萨饼。它可以安装在卡车的后部并部署在任何地方。客户可以从菜单中订购或创建自己的比萨饼。餐饮服务行业目前正面临全球劳动力短缺的问题，预计未来十年这种情况将进一步恶化。像 Stella Pizza 这样的自动化解决方案提供了一种经济高效的方式来填补食品行业中不需要的职位。

最先进的图像生成模型–Aran Komatsuzaki

**********************************\[摘要\]：**********************************说到深度学习的生成和创造性用途……在这篇博文中，深度学习研究员 Aran Komatsuzaki 汇总了最近发布的一些 SotA 图像生成模型，包括简短的摘要、可视化、代码（如果可用）等。这是深入研究生成式深度学习研究状态的一个很好的起点——这是今年深度学习领域的一个主要趋势，我们在这篇文章中介绍的论文属于SotA图像生成模型的以下范例之一：VAE:VDVAE和VQVAE变体提供SotA多样性。

周志华教授：关于深度学习的一点思考

**********************************\[摘要\]：**********************************经过机器学习界的努力，现在已经有很多有效训练深度神经网络这种复杂模型的技巧，例如很多缓解神经网络梯度消失的办法。我们最近在这方面进行了一些初步探索，提出了深度森林这种非神经网络的新型深度学习模型。它初步验证了上一节中关于深度学习奏效原因的猜想，即只要能做到逐层加工处理、内置特征变换、模型复杂度够，就能构建出有效的深度学习模型，并非必须使用神经网络

**Meta，收购了合成数据初创公司 AI，将其整合到致力于构建共享虚拟世界的 Reality Labs 部门**  

**********************************\[摘要\]：**********************************前Reverie 的首席执行官 Daeil Kim 现在是 Meta 的工程经理，他将公司描述为“几乎无休止地提供带注释的图像和视频，通过降低培训成本来加速计算机视觉和机器学习”。今年早些时候，这家初创公司表示已将其合成数据生成平台授权给国防、零售、工业和农业领域的客户，并在 2020 年将其客户群增加了两倍。

**AI 辅助招聘平台Paradox在 C 轮融资中筹集了 2 亿美元。资金由 Stripes、Sapphire 和 Thoma Bravo 共同投资**  
************************************\[摘要\]：************************************该公司开创了一种基于 AI 助手的方法来与潜在员工交谈并自动执行任务。Paradox 的应用程序可以自动化候选人筛选、面试安排和入职流程。助手可以回答重复的候选人问题，筛选申请人的职业要求，安排（并经常重新安排）面试，发送提醒以完成文书工作或接受报价 ，Paradox 声称其软件已帮助麦当劳门店减少了 60% 的招聘时间。其 500 多个全球客户包括麦当劳、联合利华、通用汽车和 CVS Health 等公司。

送餐机器人“走红”，市场规模近12亿元

************************************\[摘要\]：************************************国内不少的机器人制造商都具备了更加先进的技术实力，在开发机器人产品方面也更加得心应手，并且在不断提升送餐机器人的环境感知和运动控制能力，这使得机器人在送餐的过程中可以有更加稳定、良好的表现，从而获得餐厅、顾客的一致认可。

**02＃产品市场创新**

**Meta、Microsoft 和其他公司的 Metaverse 产品只是 3D 虚拟社交空间，缺乏 Metaverse 概念的关键特性，主要是互操作性**

**********************************\[摘要\]：**********************************虽然元宇宙的定义各不相同，但大多数支持者都认为它不仅仅涉及戴上虚拟现实护目镜或增强现实眼镜以及与化身互动。它意味着通过技术标准连接无数较小的数字世界和体验，允许用户在它们之间移动，随身携带他们的虚拟身份、社会关系和财，风险投资家马修鲍尔的一个被广泛引用的定义始于这样一个前提，即它是一个“实时渲染的 3D 虚拟世界的大规模和可互操作的网络”，它可以跨时间跨平台和设备持续存在。确实存在的是一个想法，大肆炒作，以及一群希望利用这两者的竞争对手应用程序和平台——在想法和现实之间没有明确的路径。

AWS 推出 re:Post，一种新的社区驱动的问答服务

**********************************\[摘要\]：**********************************“AWS re:Post 是一项 AWS 管理的问答服务，为您提供有关 AWS 的技术问题的众包、专家评审答案，取代了原来的 AWS 论坛，”该公司在一篇关于该公告的博客文章中解释道。“社区成员可以通过提供公认的答案和审查其他用户的答案来获得声誉积分，以建立他们的社区专家地位，这有助于不断扩展所有 AWS 服务的公共知识的可用性。”

**人工智能和物联网技术将在本周的 2022 年国际消费电子展上成为焦点**

**********************************\[摘要\]：**********************************人工智能机器人公司Ubtech计划推出新的医疗保健机器人，包括人形步行辅助机器人，Ekin 自动车牌阅读器和其他支持人工智能的产品，Phiar计算机视觉驱动的汽车增强导航系统等，人工智能物联网相关的技术应用带来很多新体验和应用，CES主办方宣布，该贸易展将于 1 月 7 日提前一天结束。

无人机创新从硬件转向自动飞行软件

**********************************\[摘要\]：**********************************Shield AI 只是数十家致力于改变无人机使用方式的公司之一，将它们从有人驾驶的傻瓜式飞行相机转变为可以在团队中工作并将数据直接传输到云端的自动飞行计算机.虽然无人机的设计和电池寿命已经有了巨大的飞跃，但真正的创新不是来自硬件，而是来自它们的计算能力。ModalAI 是一家从芯片制造商高通公司分拆出来的部门，该部门向无人机公司出售技术，据统计，美国约有 65 家初创企业试图为无人机配备最新的软件和人工智能。

Oculus 应用程序是新用户设置耳机所必需的，它在圣诞节的 Apple App Store 排行榜上飙升至第一名

************************************\[摘要\]：************************************击败了流行且几乎无处不在的社交媒体应用程序 TikTok、YouTube 和 Instagram。如果 Oculus 应用图表位置表明新耳机的使用率很高，那么应用销售数字和玩家群增长表明这些新用户也热衷于体验 VR 体验。

**商汤集团成功上市，CEO徐立发表致辞：用AI的百点热，耀出时代千分光**

************************************\[摘要\]：************************************商汤集团联合创始人、董事长兼CEO徐立博士在上市仪式致辞中表示，“商汤人始终坚信人工智能技术变革带来增量价值，必将推动普惠和公平的智能时代到来。也正因此，商汤得以在7年时间里，成长为亚洲人工智能的领军企业，一次次用技术突破去重新定义场景和模式，去刷新行业、刷新大众对于人工智能的认知。但商汤人始终坚信人工智能技术变革带来增量价值，必将推动普惠和公平的智能时代到来。

**万科总部年度优秀新员工， 竟然不是人类？**

************************************\[摘要\]：************************************万科集团董事会主席郁亮，在微信朋友圈发了一则信息：“祝贺‘崔筱盼’获得2021年万科总部优秀新人奖，她催办的预付应收/逾期单据核销率达到91.44%。今年2月1日正式“入职”，在系统算法的加持下，她很快学会了人在流程和数据中发现问题的方法，以远高于人类千百倍的效率在各种应收/逾期提醒及工作异常侦测中大显身手。万翼科技不仅在推动万科管理流程的数字化，更研发出了面向复杂地产业务的AI智能审图等产品，据说，他们已支持审查建筑、结构、给排水、暖通、电气五大专业图纸，审图效果达到人类的8倍。比如之前涛哥去龙湖集团参观，看到龙湖总部也使用了大量机器人，有帮员工办理工牌、开在职证明、自助报销的，还有能接待访客、引导参观等。

颇受资本青睐的酒店机器人，何时能成行业“标配”？

************************************\[摘要\]：************************************酒店机器人、清洁机器人可有效提升工作效能。其机械臂和移动技术的结合，能在陌生环境下精准扫描空间，通过机器人携带的各种工具针对不同目标进行清洁，通过人机协作的方式，帮助酒店工作人员更高效的实现酒店清洁。在智慧酒店的发展趋势之下，机器人的投入应用不仅帮酒店员工分担了枯燥繁琐的工作，还改善了旅客的入住体验。

**03＃监管与合规  
  
**

网络安全审查办法

************************************\[摘要\]：************************************国家互联网信息办公室主任 庄荣文国家发展和改革委员会主任 何立峰工业和信息化部部长 肖亚庆公安部部长 赵克志国家安全部部长 陈文清财政部部长 刘 昆商务部部长 王文涛中国人民银行行长 易 纲国家市场监督管理总局局长 张 工国家广播电视总局局长 聂辰席中国证券监督管理委员会主席 易会满国家保密局局长 李兆宗国家密码管理局局长 刘东方2021年12月28日 网络安全审查办法 第一条 为了确保关键信息基础础设施供应链安全，保障网络安全和数据安全，维护国家安全，根据《中华人民共和国国家安全法》、《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《关键信息基础设施安全保护条例》，制定本办法。

国家互联网信息办公室等四部门发布《互联网信息服务算法推荐管理规定》  

**********************************\[摘要\]：**********************************国家互联网信息办公室有关负责人表示，出台《规定》，旨在规范互联网信息服务算法推荐活动，维护国家安全和社会公共利益，保护公民、法人和其他组织的合法权益，促进互联网信息服务健康发展。

**Alexa 告诉孩子尝试危险的特技，因为这是搜索引擎所说的，亚马逊迅速删除了令人担忧的结果**

**********************************\[摘要\]：**********************************根据 BBC 的一份报告，Alexa 发现了她所谓的“一分钱挑战”，这是一种病毒式的特技，人们将手机充电器的一部分插入墙上的插座，然后用一分钱接触暴露的插脚。Alexa 显然向小女孩描述了挑战是如何运作的，亚马逊表示：“客户信任是我们所做一切的核心，Alexa 旨在为客户提供准确、相关和有用的信息。一旦我们意识到这个错误，我们就采取了迅速采取行动修复它。”

**中国对大型科技公司的打击：在新的数据法和清理活动的推动下，应用程序数量在 3 年内下降了 40%**

************************************\[摘要\]：************************************根据《南华早报》对工信部汇编的数据，截至今年 10 月，中国应用商店在 10 月份只有 278 万个应用程序，低于 2018 年 12 月的 452 万个。在过去三年中，中国智能手机用户可以使用的应用程序数量下降了 38.5%，今年降幅最大的是国家对大型科技平台和互联网内容的打压，显示了中国强化的市场结构如何对数字行业造成了影响。

---
## 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://haxitag.com/brief/ai-brief-20220104-ai202214](https://haxitag.com/brief/ai-brief-20220104-ai202214)
**来源索引（站内可追溯）**：[麦肯锡](https://haxitag.com/search?q=%E9%BA%A6%E8%82%AF%E9%94%A1)、[普华永道](https://haxitag.com/search?q=%E6%99%AE%E5%8D%8E%E6%B0%B8%E9%81%93)、[Gartner](https://haxitag.com/search?q=Gartner)、[IDC](https://haxitag.com/search?q=IDC)、[Forrester](https://haxitag.com/search?q=Forrester)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。
