首页 AI写作 正文

1月,百度云的这些AI能力悄悄升级了

1月,百度云的这些AI能力悄悄升级了

一月份,百度云的这些AI能力悄然升级。

你有没有感觉到,AI作为时代的宠儿,每天都在快速迭代?这不,走在技术前沿的百度云也在不断将AI能力融入到产品和解决方案中,方便开发者和用户将其应用到业务中,实现企业的智能化转型。

接下来我们将为大家介绍一下百度云1月份的AI技术更新,希望对您的业务有所帮助。

全新开放AI技术能力

在AI技术能力方面,1月份,百度云在图像识别、人体分析、OCR、自然语言处理四个技术方向提供了新的能力,这也催生了更多的业务场景。

图像识别。一月份添加了两项新功能:车辆分析和红酒识别。

在车辆分析的车型识别能力上,可以识别近3000种常见车型。例如,它可以识别汽车型号、年份、颜色、百科词条等信息。在流量统计能力中,根据视频采集图像序列进行车辆检测和跟踪,识别指定区域内各类车辆的进出,并绘制包含统计值和跟踪的渲染结果图可以输出帧。除了这两项能力外,车辆分析能力还包括车辆检测、车辆外观损伤识别等能力,适用于拍照识别车辆、违章停车监控、路况分析、智能损伤评估等场景。

红酒识别就是输入一张红酒图片(酒标清晰可见),即可识别图片中的红酒名称,方便在电商购物、红酒识别等场景使用。

人体分析。人流统计(动态版)公测上线,主要针对商店、通道等出入口场景。该统计以头部和肩膀作为人体检测和跟踪的识别目标。可根据目标轨迹确定进出方向,实现动态人流统计,大幅提高识别率和准确率。

OCR方面。目前已开放测试三个新接口:保单识别、税务局普通机打发票识别、行程识别。这意味着百度云OCR能力的准确率得到了提升,适用于各种复杂环境,处理能力也将得到大幅提升。这对于大多数需要使用OCR环境的场景来说是个好消息。

自然语言处理。一月份增加了一系列新的智能写作功能。正如我们之前报道的那样,智能写春联、智能写诗(“商界拜年,今年你可以换个方式”)的能力已经在春晚中得到了运用,受到了很多企业的欢迎,他们的营销活动有很多。少一点乐趣,提高营销的用户体验和传播价值。此外,本次还新增了结构化数据写入、热点事件上下文、字符图功能接口,满足各类智能写入业务需求。

总体而言,此类能力融合了百度云领先的自然语言处理和知识图谱技术,提供自动写作和辅助写作能力,全面提升内容创作效率,旨在成为最懂你的智能写作助手。它广泛应用于媒体和内容创建行业、商业智能、行业报告和咨询以及营销和活动。

优化5大AI技术模型

从AI技术模型优化的角度来看,1月份模型的易用性表现得到了大幅提升,让开发者更容易使用。

图像识别。通用对象和场景识别的高级版本可供购买。除了每天提供500个免费通话外,您还可以付费购买更多通话。可按照后付费阶梯定价(2-3元/千张)定价,并享受10QPS的稳定并发能力。

图片搜索。图书馆管理后台易用性升级,支持检索结果在线测试。同图搜索、相似图搜索、商品图搜索同步升级。无需调整界面即可测试体验图片搜索的真实效果。

人脸识别。人脸离线识别SDK全面升级,各方面速度都有所提升。这体现在人脸检测、活体检测和特征提取速度提高了150%。全新生活照和证件照模型的准确率较去年1.0系列提升了近1.5%。重写了20多个底层API,开发量减少30%。新增的人脸识别、身份证比对等场景化示例项目,新增了10余种场景化配置能力,1分钟即可跑完整个流程。业务逻辑、二次开发满足各种场景的详细需求等

另外,人脸检测进行了升级,可以快速检测人脸并返回人脸框的位置。定位面部特征和轮廓的关键点数量也从72个增加到150个,可以更好地支持人脸特效场景。人脸搜索1:N识别接口的maxusernum参数上限从20提高到50,最多支持返回50张相似人脸。

人体分析。手势识别模型升级,新增“中指”手势,目前共支持24种手势。该功能可用于审计场景。人体检测与属性识别模型升级,模型算法优化,新增属性“是否为正常人体”,所有属性新增“不确定”输出项的值区分不确定的识别结果,例如吸烟属性。之前的输出项是“不吸烟”,吸烟”现在是“不吸烟,吸烟,不确定”。

自然语言处理。优化评论观点提取(定制版),输出标签不再局限于现有的“名词形容词”形式,解决了原有名词和动词的问题。(例如:包裹损坏)问题无法提取。

定制平台和工具

为了方便企业和开发者更好地开发和使用,平台和工具的定制仍然是AI能力升级的重点。1月,EasyDL定制培训与服务平台、理解与交互技术UNIT取得重大突破。

EasyDL定制培训和服务平台

物体检测中的“高精度标准算法”分布式训练后端优化,可以将训练模型的时间缩短到原来时间的1/2-1/3。新增实时查看模型训练进度的功能。此外,还可以添加短信提醒,训练完成后会收到提醒信息,让用户实时了解整个过程的进度。新增云服务调用数据功能,可用于管理调用接口时上传的数据,提高模型的迭代效率,实现训练数据的不断丰富和模型效果的持续优化。

理解与互动技术单元

1.新增6个预设技能

1)电视剧:可用于搜索电视剧的场景,支持精准搜索和模糊匹配。

2)机器人控制:分析用户与智能机器人的交互指令,提供做表情、拍照、举手等指令。

3)提醒:提供日程管理功能,包括设置、查询、删除提醒。

4)发送微信:识别用户对微信的操作指令,支持打开和关闭微信应用、发送和接收微信消息等功能。

5)发送短信:识别用户对短信的操作指令,支持打开和关闭短信应用、发送和接收短信等功能。

6)屏幕控制:分析智能设备屏幕控制指令,提供划屏、列表排序选择、翻页等控制指令。

现在,UNIT共提供了23种预设技能,开发者只需点击鼠标即可轻松获得对应场景的智能对话能力。

2、正式上线“技能复制”功能

开发者可以使用该功能将技能复制到任意账户。基于该功能,您可以快速备份技能、迁移账户技能、复制多个技能进行类似业务的二次开发。

3、“UNIT对话测试助手”小程序新增机器人及预设技能体验功能

UNIT对话测试助手小程序在原有支持自定义技能的基础上,增加了机器人对话效果体验功能和预设技能。也可以通过分享小程序的方式展示给其他开发者。

AI硬件产品与服务

远场语音开发套件发布。远场语音开发套件集成了软件和硬件,包括麦克风阵列和开发板。它支持声源定位和噪声消除等信号处理算法,5米内完美拾音,并支持远场唤醒、远场识别和语音合成能力,使语音开发评估更加轻松高效。

EasyEdge端计算模型生成平台发布。可基于多种深度学习框架和网络结构的模型,生成高性能的端计算模型并以零代码封装SDK,适配多种AI芯片和操作系统,模型识别速度最高可提升10倍。

以上给大家介绍了这么多AI能力升级。你想体验一下它们吗?1月份AI体验中心小程序也有新的突破。新推出的三项能力分别是人像分割、情感识别、智能春联。对语音识别服务进行了优化,实现更低的延迟,并在小程序中添加了识别和合成时间信息。

关注百度云微信公众号即可体验

本文转载自互联网,如有侵权,联系删除

本文地址:https://www.5i818.cn/2587.html

相关推荐

发布评论

文章目录