Azure AI 服务
通过现成的预生成可定制 API 和模型,帮助开发人员和组织快速创建智能、前沿、面向市场且负责任的应用程序。
本文介绍提供视频和图像处理功能的 AI 服务,例如视觉分析和图像生成、对象检测、图像分类和面部识别。
以下服务为 AI 服务提供视频和图像处理功能:
Azure OpenAI 服务
使用
Azure OpenAI 及其预训练的生成图像模型从自然语言生成图像。 例如,可以使用 Azure OpenAI 按需生成自定义艺术。
使用
Azure OpenAI 当需要对图像进行非特定和广泛的分析时。 例如,可以使用 Azure OpenAI 生成辅助功能说明。
请勿使用
Azure OpenAI,如果您想使用 Azure 机器学习中提供的开源图像生成模型。
请勿使用
如果需要执行特定类型的图像处理(例如表单提取、人脸识别或域专用图像特征检测),Azure OpenAI。 对于这些方案,请使用或生成专为这些目的设计的 AI 解决方案。
自定义视觉
自定义视觉
是一种图像识别服务,可用于生成、部署和改进图像标识符模型。 图像标识符会根据图像的视觉特征将标签应用到这些图像上。 每个标签都表示一个分类或对象。 使用自定义视觉指定自己的标签并训练自定义模型以检测它们。
自定义视觉使用机器学习算法分析自定义功能的图像。 提交分别具有和不具有所需视觉特征的图像集。 然后在提交时,用您自己的标签或
标记
标注图像。 此算法会针对该数据进行训练并计算其自己的准确度,方法是针对相同的图像自行进行测试。 训练模型后,可以测试、重新训练并最终使用图像识别应用中的模型对图像或检测对象进行分类。 也可导出模型,方便脱机使用。
下表提供了自定义视觉中可用的功能列表。
Azure AI 面部识别
Azure AI 人脸
提供用于检测、识别和分析图像中人脸的 AI 算法。 面部识别软件在各种场景中非常重要,例如识别、无触摸访问控制和自动面部模糊处理隐私。
下表提供了 Azure AI 人脸中可用的功能列表。
验证用户标识
根据可信的人脸图像验证身份。 此验证可用于授予对数字或物理属性的访问权限。 在大多数情况下,受信任的人脸图像来自政府颁发的 ID,例如护照或驾照,或者来自亲自拍摄的注册照片。 在验证期间,实时检测可以在验证图像是否来自真实人而不是印刷照片或掩码方面发挥关键作用。
编辑或模糊视频中录制的检测到的人脸,以保护其隐私。
无触摸访问控制
与卡片或票证等方法相比,选择性人脸识别能够增强访问控制体验,同时降低因物理媒体共享、丢失或盗窃而带来的卫生和安全风险。 人脸识别可以帮助在机场、体育场馆、主题公园、建筑物或者办公室、医院、健身房、俱乐部或学校的接待亭进行人工值机。
视频索引器
视频索引器
是 AI 服务的一部分的云应用。 它使用人脸、翻译器、视觉和语音等 Azure AI 工具构建。 它使你能够使用视频索引器视频和音频模型从视频中提取见解。
下表提供了视频索引器中提供的一些功能的列表。
使用从视频中提取的见解可增强整个视频库的搜索体验。 例如,对所说内容和人脸进行索引,可以实现在视频中查找特定瞬间的搜索体验,例如,查找视频中某个人说出某些话时刻,或者看到两个人出现在一起的时刻。 根据视频中的此类见解进行搜索适用于通讯社、教育机构、广播公司、娱乐内容所有者、企业业务线应用,通常适用于具有用户需要搜索的视频库的任何行业。
根据视频索引器从内容中提取的见解创建预告片、突出显示卷轴、社交媒体内容或新闻剪辑。 关键帧、场景标记以及人员和标签外观的时间戳简化了创建过程。 这些元素可帮助你快速找到创建内容时所需的视频部分。
无论你希望使内容可供残障人士使用,还是希望内容分发到使用不同语言的不同区域,都可以使用视频索引器以多种语言提供的听录和翻译。
视频索引器可以帮助增加视频的价值。 例如,依赖于广告收入的行业(如新闻媒体和社交媒体)可以通过将提取的见解用作广告服务器的其他信号来提供相关广告。
使用文本和视觉内容审查模型使用户免受不适当的内容的安全,并验证发布的内容是否与组织的值匹配。 你可以自动阻止某些视频,或向用户发出有关这些内容的警报。
视频见解可以通过向用户重点显示相关视频瞬间来提高用户的参与度。 通过用额外的元数据标记每个视频,可以向用户推荐最相关的视频,并突出显示与其需求匹配的视频部分。
什么是视觉?
学习路径:使用 AI 服务开发自然语言处理解决方案
学习路径:AI 服务入门
学习路径:Microsoft Azure AI 基础知识:计算机视觉
学习路径:使用视觉创建计算机视觉解决方案
学习路径:使用 Azure IoT Edge 和 AI 服务创建图像识别解决方案
目标语言处理指南
语音识别和生成指南