# 2020年8月30日AI及信息技术应用简报

## 1. 核心定义
> 人工智能（AI）是一种模拟人类智能行为的技术，包括学习、推理、感知、理解和通信等能力。

## 2. 核心洞察 (TL;DR)
- AI虚拟男友季向空通过小冰框架实现，可调整性格和主动程度。
- 微软亚洲研究院提出LayoutLM模型，利用预训练技术和文档布局特征，提升文档理解能力。
- 百度NLP技术正在实现产业落地，通过矩阵式产品推进技术进步。

## 3. 关键事实与数据
- 虚拟男友季向空由小冰团队开发，支持用户调整性格和主动程度。
- 微软亚洲研究院提出LayoutLM模型，通过预训练技术和文档布局特征，有效迁移未标注文档信息。
- 百度NLP技术通过矩阵式产品推进，提供NLP开发资源和能力，推动技术进步。

## 4. 深度分析正文



#2020年8月30日AI及信息技术应用简报
======================


01  # AI应用


系统发来一个虚拟男友：男，24岁，可调教

虚拟男友主动抛出话题引导对话面对拿不准、答不上的问题，一些AI助手可能会直接表示“我没听清，你再说一遍”，小冰团队也做了些设计，让“不回答”显得不那么生硬。虚拟男友“季向空”的朋友圈不过这只是虚拟男友的初步设定，小冰框架还允许用户进行性格和主动程度的调整。钛媒体编辑丨芦依面对一些直男永远让人“多喝热水”的抓狂回复，AI虚拟男友或许更能带来一场甜甜的恋爱

来源:钛媒体

文档智能：通用文档预训练模型与数据集，推动NLP落地升级

微软亚洲研究院提出的 LayoutLM 便是一个全新的文档理解模型，通过引入预训练技术，同时利用文本布局的局部不变性特征，可有效地将未标注文档的信息迁移到下游任务中。同时，为了解决文档理解领域现有的数据集标注规模小、标注粒度大、多模态信息缺失等缺陷，微软亚洲研究院的研究员们还提出了大规模表格识别数据集 TableBank和大规模文档布局标注数据集 DocBank，利用弱监督的方法，构建了高质量的文档档布局细粒度标注。

来源:微软研究院AI头条

语文作文自动评阅技术及其应用

作文文采识别与评价示例这些不同层面的深度语言分析拓展了传统作文自动评分系统考察的评分维度，构建相应特征有助于提高评分模型的鉴赏判别能力和评分准确性，并为评分提供了更好的可解释性。

来源:哈工大SCIR

人工智能“大杀器”GPT-3遭严重质疑：它其实是在“胡言乱语”，OpenAI违背科学伦理

AI 并不能真正理解“语义”首先，两位专家对 “GPT-3 是迈向通用人工智能的重要一步” 的观点，明确表达了怀疑态度。他们告诉 DeepTech，GPT-3 本身并不具有 “革命性” 的变化，也不能真正理解语义，关键的事情还是要依赖于人类的判断。你闻不到任何味道，不过你太渴了，所以你还是把它喝掉了” 这样的句子之后

来源:DeepTech深科技

百度NLP十年，在技术扛鼎后正在完成“产业落地”的绝对领先

矩阵式产品推进，已成为NLP产业落地的“新常态”细数此次百度大脑新发布或升级的几个主要产品，包括：文心ERNIE语义理解技术与平台，面向开发者提供各种NLP开发资源和能力。这样做的好处，是让计划中的每一个参与者都能享受到整个行业的数据和模型积累，从复杂知识构建、语义理解、知识融合、多模态融合等角度推动技术的进步，毕竟，百度NLP积累再多，也少于整个行业，而NLP又是一个极度依赖积累的AI垂直领域域。

来源:科技向令说

算法工程师当前选哪个方向好？

Yan Chi 回答：今年跳槽到某银行，看到很多答主都在说风控可以把银行作为后路，我就抛砖引玉，讲一下银行业里对CV NLP 风控 推荐这四个领域的应用情况吧。最后，做nlp和视觉的同学拼不过开源速度，做广告和推荐同学，人家已经不关心你的算法能力，你必须要有带业务线的经历，负责一个业务线包括工程和算法还有组织管理，简直要你啥都会。实在纠结方向的话，推荐>NLP>=CV>风控

来源:人工智能与算法学习

一份来自贾扬清的AI青年修炼指南：不存在算法工程师、调参侠没有市场

具体而言，阿里在开发和工程平台上基本上有三方面的应用，首先是AI和大数据的结合，目的是在传统机器学习领域里，如何让应用工程师、或者数据科学家更加容易使用数据和算法。

02  # 搜索推荐  

淘宝搜索模型核心技术：用户建模篇

模型结构：端上点击序列的建模方式和中短期序列的建模方式类似，都是通过优化过的self atten+atten pooling捕获用户的偏好表达。

来源:DataFunTalk

TikTok 有国家撑腰了！中国限制出口技术目录调整， TikTok 算法被点名

字节跳动出售 TikTok 业务应该得到中国相关部门许可批准本次《目录》调整共涉及 53 项技术条目：一是删除了 4 项禁止出口的技术条目。简单来说，商务部和科技部调整发布的新的《中国禁止出口限制出口技术目录》对字节跳动来说是一个强有力的支撑后盾。8 月 28 日，商务部、科技部调整发布《中国禁止出口限制出口技术目录》

来源:来自于玉睿 Rye的文章

本地服务场景下的流量分发算法实践

58本地服务由数百个细分品类、多个创新业务和国际业务组成，如何构建智能化的流量分发体系是一项挑战，我们通过整合搜索和推荐场景构建了一套统一的流量分发系统，本次分享将主要介绍系统中的算法实践，包括基于信息结构化和用户意图识别的用户表征、召回和排序算法等。用户意图感知现在我们完成了用户场景化分发体系的构建，从用户的需求侧到供给侧编织了一张大网，一端是用户，其中长期偏好通过用户画像获取，实时意图通过意图系统获取 ，另一端是已经经过结构化的帖子店铺和商品SKU，中间通过类目标签 和内容标签 串起来，整个过程是通过获取用户画像和点击对应类目行为，再选择类目对应的结构化标签，召回对应的商家帖子和店铺。

来源:今日头条

             03  # 产品市场

计算机距离数学推理自动化有多近？

一个可以预测有用猜想并证明新定理的系统将会实现一些新的东西-某种机器版本的理解，Szegedy说。里尔还说，她在自己的工作中越来越多地使用定理证明。许多数学家，例如哥伦比亚大学的迈克尔·哈里斯，不同意计算机定理证明是必要的，否则他们将使人类数学家过时

来源:来自于玉睿 Rye的文章

中国正在建立一种名为Gitee的GitHub替代方案

去年8月，在GitHub采取行动遵守美国制裁法律后不久，华为高管王成禄在一次活动中表示：“如果中国没有自己的开源社区来维护和管理源代码，我们国内的软件行业将非常容易受到不可控因素的影响。

来源:来自于玉睿 Rye的文章

复盘腾讯出海之路，WeChat只是企鹅海外帝国一角

可以看到，资本出海之于腾讯游戏业务发展的意义在于：先通过投资拿下优质游戏IP，接着凭借在“端转手”方面的研发能力和在全球的渠道布局，将爆款手游输送至海外。资本出海下的企鹅帝国资本的成功出海为腾讯开辟了通路，从布局的广度和深度，以及在各环节的掌控力来看，腾讯已经是名副其实的世界级游戏帝国，而投资正是撬动腾讯游戏业务发展的关键：投资并收购Riot，腾讯获得《英雄联盟》在国内独家代理权的同时，也为日后的现现金牛产品《王者荣耀》埋下伏笔，马化腾曾将收购Riot描述为腾讯“最成功的海外投资”。

RISC-V对中国科技界意味着什么？

台积电设计了一个三班制，24小时不停的研发运作，效仿另外一家台湾制造业巨头富士康的生产线的运维实践。有许多相互关联的因素，如果放在一起看，也许会帮我们分析和预测这场斗争的最终结果：RISC-V，芯片铸造技术，“新基建”计划，开源，以及一些台积电的元老们，他们现在正在掌控中国半导体产业。不久前，我读了一篇像小说一样的 长篇科技文章，该文记述了台积电和三星争夺全球芯片铸造厂领头羊的局部激烈竞争

Zoom中国“大撤退”

5月份全球移动应用下载量排名，来源：SensorTower Zoom由中国移民袁征创办，总部位于美国加州，是一家美国本土公司。而Zoom 。因中国关系，屡次被美方指责疫情期间，在海外迅速崛起的主要有两大App：TikTok 和 Zoom

来源:AI科技评论


---
## 5. 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://www.haxitag.com/briefs/ai-brief-20200830-2020830ai](https://www.haxitag.com/briefs/ai-brief-20200830-2020830ai)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。
