各位小伙伴有没有感觉到,AI作为时代的宠儿,每天都在快速迭代。这不,站在技术最前沿的百度云,也在不断将AI能力纳入到产品和解决方案中,以方便开发者、用户应用到业务中,实现企业的智能化转型。

1月,百度云的这些AI能力悄悄升级了

接下来,我们将为您呈现百度云1月份AI技术的更新情况,希望对您的业务有所帮助。

新开放AI技术能力

AI技术能力方面,1月,百度云在图像识别、人体分析、OCR、自然语言处理四个技术方向均有新能力提供,从而也催生了更多业务场景。

  • 图像识别。1月新增两种能力:车辆分析和红酒识别。

在车辆分析的车型识别能力中,可以识别近3000款常见车型,比如可以识别小汽车的车型、年份、颜色、百科词条等信息。而在车流统计能力中,则根据视频抓拍图像序列,进行车辆检测和追踪,识别指定区域内各类车辆的进出情况,可输出含统计值和跟踪框的渲染结果图。除了这两个能力之外,车辆分析能力还包括车辆检测、车辆外观损伤识别等能力,适用于拍照识车、违停监测、路况分析、智能定损等场景下使用。

红酒识别则是输入一张红酒图片(酒标清晰可见),就能识别图片中的红酒名称,方便在电商购物、红酒鉴定等场景使用。

  • 人体分析。人流量统计(动态版)公测上线,以面向门店、通道等出入口场景为主,此统计以头肩为识别目标,进行人体检测和追踪。可根据目标轨迹判断进出方向,实现动态人流量统计,极大提高识别率和精准度。
  • OCR方面。3个新接口邀测上线:保单识别、税务局通用机打发票识别和行程单识别。这意味着百度云OCR能力的准确度提升,适合多种复杂的环境,处理能力也将大大提升。这对于大多数需要使用OCR环境的场景来说,是一个好消息。
  • 自然语言处理。1月新增智能写作一系列能力。像之前我们报道过的智能写春联、智能写诗(《企业拜年,今年可以换种方式了》)能力,已经在春晚中得到应用,并受到不少企业的欢迎,为它们的营销活动增加不少乐趣,提升营销的用户体验和传播价值。除此之外,本次还增加了结构化数据写作、热点事件脉络、人物图谱功能接口等,可满足各类智能写作业务需求。

总体来说,这类能力集合了百度云领先的自然语言处理和知识图谱技术,提供自动写作和辅助写作的能力,全面提升内容创作效率,旨在成为最懂你的智能写作助手,广泛应用在媒体与内容创作行业、商业智能、行业报告与咨询机构和市场营销与活动中。

优化5大AI技术模型

从AI技术模型优化角度来说,1月模型易用性能大幅提升,方便开发者调用。

  • 图像识别。通用物体和场景识别高级版开放购买。除了提供500次/天免费调用量外,还可以开通付费购买更多的调用量。可按照后付费阶梯计价(2-3元/千张),并享受10QPS的稳定并发能力。
  • 图像搜索。图库管理后台易用性升级,支持在线测试检索效果。相同图搜索、相似图搜索、商品图搜索同步升级,不用调接口就能测试体验以图搜图的真实效果。
  • 人脸识别。人脸离线识别SDK全面升级,各方面的速度有所提升,这表现在,人脸检测、活体检测、特征抽取速度提升150%,全新生活照及证件照模型精度同比1.0系列提高近1.5%,重写20余个底层API,降低了30%的开发量,新增的人脸通行、人证比对场景化示例工程,增加了10余个场景化配置能力,可在1分钟跑通全流程业务逻辑,应对各类场景细节需求的二次开发等。

此外,人脸检测升级,可以快速检测人脸并返回人脸框位置,定位五官与轮廓关键点数量,也从72个增加至150个,可更好的支持人脸特效场景。人脸搜索的1:N识别接口max_user_num参数上限从20增加到50,支持最多返回50个相似人脸。

  • 人体分析。手势识别模型升级,增加“竖中指”手势,现共累计支持24种手势。该功能可用于审核场景。人体检测与属性识别模型升级,优化模型算法,增加“是否正常人体”属性,所有属性增加“不确定”输出项取值,区分不确定的识别结果,例如吸烟属性,以前输出项为“未吸烟、吸烟”,现在则为“未吸烟、吸烟、不确定”。
  • 自然语言处理。评论观点抽取(定制版)优化,输出标签不再局限于现有“名词+形容词”的形式,解决原名词+动词(如:包裹破损)提取不出来的问题。

定制化平台与工具

为方便企业与开发者更好地研发使用,平台与工具的定制化依旧是AI能力升级的重点。1月在EasyDL定制化训练及服务平台、理解与交互技术UNIT均有较明显的突破。

  • EasyDL定制化训练及服务平台

物体检测中“高精度标准算法”分布式训练后端优化,可将训练模型所用时间缩短至原先的1/2-1/3时间。新增可实时查看模型训练进度功能。此外,还可以添加短信提醒,训练完成时就会收到提醒信息,实现用户实时掌握全流程进度情况。新增云服务调用数据功能,可用于管理调用接口时上传的数据,提高模型的迭代效率,实现训练数据的持续丰富和模型效果的持续优化。

  • 理解与交互技术UNIT

1、新增6个预置技能

1)电视剧:可用于电视剧查找的场景,支持精确搜索与模糊匹配。

2)机器人控制:解析用户与智能机器人的互动指令,提供做表情、拍照、举手等指令。

3)提醒:提供日程管理的功能,包括设置、查询及删除提醒。

4)发微信:识别用户对微信的操作指令,支持打开和关闭微信应用、收发微信等功能。

5)发短信:识别用户对短信的操作指令,支持打开和关闭短信应用、收发短信等功能。

6)屏幕控制:解析控制智能设备屏幕的指令,提供屏幕划动、列表的排序和选择、翻页等控制指令。

现在,UNIT已累计提供23个预置技能,开发者只需点点鼠标即可轻松获取对应场景的智能对话能力。

2、正式推出“技能复制”功能

开发者可通过该功能,将技能复制到任意账号中。基于此功能,可快速实现技能的备份、账号技能迁移,以及复制多个技能进行二次开发用于相似业务。

3、“UNIT对话测试助手”小程序,新增机器人和预置技能体验功能

UNIT对话测试助手小程序在原有支持自定义技能的基础上,增加机器人、预置技能的对话效果体验功能,还可以通过分享小程序来向其他开发者展示。

AI硬件产品与服务

  • 远场语音开发套件重磅发布。远场语音开发套件集软硬件一体,包含麦克风阵列和开发板,支持声源定位、噪声消除等信号处理算法,5米内完美拾音,支持远场唤醒、远场识别、语音合成能力,使语音开发评估更简便、高效。
  • EasyEdge端计算模型生成平台重磅发布。可基于多种深度学习框架、网络结构的模型,零代码生成高性能端计算模型及封装SDK,适配多种AI芯片与操作系统,模型识别速度最高可提升10倍。

以上为大家介绍了这么多AI能力升级,想不想体验一下?1月AI体验中心小程序也有新突破。全新上线了3项能力,分别是人像分割、情绪识别、智能春联。在语音识别服务方面进行了优化,时延更低,并在小程序中增加了识别、合成用时信息。

关注百度云微信公众号,就可体验哦 ')}