亲爱的读者朋友们,你们期待的AI技术升级又来了,应用场景更多了。

在刚刚过去的四月,百度智能云的小伙伴又给大家带来了哪些AI技术上的新体验呢?和以往一样,我们还是从AI技术能力上新、AI技术模型升级和定制化平台与工具几个方面汇报吧。

百度智能云AI技术又上新了这些功能,新的技术体验究竟有多棒?

更多AI技术能力上新

我们按照技术分类来梳理。

➤ 语音合成离线SDK上线邀测中 

这次上线的语音合成离线SDK可以满足无网或弱网环境下的APP、机器人、硬件设备播报需求,提供稳定、一致的合成体验。

➤ 文字识别OCR多票据分类 

这一技术的升级可谓是财务工作者的福音,能够对一张发票粘贴单中的多种票据进行检测分类,现已支持增值税发票、增值税卷票、定额发票、机打发票、火车票、出租车票、行程单7种票据。

➤ 货币识别邀测中

货币识别技术可以识别图像中的货币类型、返回货币名称、代码、面值、年份信息等细节,现已支持识别各类近代常见货币,如美元、欧元、英镑、法郎、澳大利亚元、俄罗斯卢布、日元、韩元、泰铢、印尼卢比等。比如金融机构外汇兑换时,就可用货币识别技术自动识别货币类型,弥补人工判断知识面受限、主观失误等问题,提升兑换效率。

➤ 车辆外观损伤识别邀测中 

针对常见小汽车车型,识别车辆外观受损部件及损伤类型,可识别数十种车辆部件、五大类外观损伤(刮擦、凹陷、开裂、褶皱、穿孔)。可以用于车主或保险公司对车辆拍照后的智能定损,以及租车或共享汽车在对汽车使用前后的车况审计场景中,让车辆外观损伤审核效率提高不止一点。 

持续优化AI技术模型

在技术模型方面,提升了相关技术的准确率,另一方面尽量降低技术操作的复杂程度。这样,企业应用AI技术的门槛更低,应用效果也将更好。

➤ 文字识别OCR 

iOCR自定义模板全面升级,支持购买更高调用量,未实名认证用户可一次性享有1000次免费调用量;完成个人实名认证,免费调用量可提升至10000次;完成企业实名认证,免费调用量可提升至50000次。购买更多调用量,价格低至0.02元/次。

增值税发票识别响应时间缩短3倍,关键字段识别率提升10%以上,每日500次免费调用量,购买更多调用量,价格低至0.02元/次。

在营业执照识别技术中,新增经营范围字段、分公司换行优化,支持新版营业执照。

➤ 通用物体和场景识别升级 

精准识别出包含动物、植物、商品、建筑、风景、动漫、食材、Logo品牌、公众人物等10万+常见物体及场景,本月后端模型升级,准确率绝对值提升7%,识别效果更精准,体验更优。可用于相册分类及智能美图等场景。

➤ 文本审核,中小客户依旧免费用,且支持购买更多并发量

文本审核服务现已提供企业级的稳定服务,在线接口毫秒级响应,实现弹性灵活的高并发承载及99.99%的可靠性保障。同时,我们升级了免费策略:调用量由原来的每天最高10000次升级为不限量调用,且提供5QPS免费并发额,相当于每天最多可免费使用432000次,充分满足了大多数中小用户的业务需求。同时我们向有更高并发需求的用户提供按照QPS购买的服务,降低企业接入AI技术的门槛,大幅减少审核的人力投入。

人体分析,人像分割模型优化升级 

本次升级,不但全面优化了算法模型,还对分割结果进行了更加完善的预处理。比如,对接口返回的人像前景图直接采用原图渲染,不再进行等比例压缩,拒绝模糊和拉伸。对结果图进行融合处理,减少白边、锯齿等边缘粗糙问题。优化分割模型,改善错误分割的情况(如:衣服颜色和背景色很相似时)。可用于人像抠图、人体特效、影视后期处理等场景。

➤ 图像识别 ,红酒识别服务升级 

整合红酒信息服务应用“酒咔嚓”的专业数据,接口输出更多结构化信息,包括:国家、产区、酒庄、类型、糖分、葡萄品种、酒品描述等。

定制化平台与工具

➤ EasyDL定制化训练及服务平台 

EasyDL商品检测专业版上线,该版本基于大规模零售数据预训练,利用了商品增强合成技术,提供更精确的定制化商品训练及识别能力。在提供丰富商品库的同时,支持检测客户的自定义商品,仅需要20张左右的商品图和实景货架图,数小时即可训练出高精度的商品检测模型。专门用于定制货架合规性检查、自助结算、无人货柜等零售场景下识别商品的高精度AI模型,可以识别商品名称和在图中的位置。

另外,EasyDL通用版物体检测支持多人同时标注数据集,提升数据标注效率。EasyDL离线服务新增高精度算法,识别准确率提升15%左右;EasyDL图像分类和物体检测离线SDK新增支持windows及linux操作系统。目前EasyDL已全面支持生成市面通用的四大操作系统IOS, Android, Linux, Windows的离线SDK,满足开发者的更全面的离线应用场景。

➤ 理解与交互技术UNIT 

问答技能上线。全新上线专为一问一答型的对话场景打造的问答技能,让问答类对话配置流程更加简便、高效。每个问答技能可支持100万条问答对,并提供标签功能帮助开发者高效管理大量的问答对,大幅降低项目成本。

「UNIT对话测试助手」微信小程序,现已全面支持体验UNIT官方预置技能。开发者复用预置技能前,可以方便地发动项目团队的小伙伴们用「UNIT对话测试助手」小程序来测试、评估、选用预置技能,测试评估无需注册登录UNIT网页平台,方便又高效。