人工智能成型的基础:数据标注
作者:小罗萝卜
更新时间:2021-09-28 10:09:47
点击数:
人工智能时代的基础—数据标注
人工智能时代,机器学习和深度学习发展迅速。
AI其实就部分替代人的认知功能。举个例子,想让机器学习认识苹果,那么就需要拿着一个苹果的图片告诉它,这是一个苹果。然后以后机器遇到了苹果的图片,你才知道这玩意儿叫做“苹果”。
机器学习需要大量这样的已经进行了分类、画框、注释等才做的数据,因此就催生了数据标注员这个岗位,就是使用自动化的工具从互联网上抓取、收集数据包括文本、图片、语音等等,然后对抓取的数据进行整理与标注。常见的数据标注任务有分类、标框、描点、转写等。分类就是我们常见的打标签。一般是从既定的标签中选择数据对应的标签,是封闭集合。例如一张图就可以有很多分类/标签:成人、女性、黄种人、长发等。对于文字,可以标注主语、谓语、宾语,名词动词等;
标框是框选要检测的对象;描点是对于特征要求细致的应用中常常需要描点标注例如人脸的眼角、嘴角、眼眶等;转写是指把数据从一种形态转换成另外一种形态,例如把语音的内容用文字写出来,一种语言翻译成另外一种语言等。在不断地学习中,人工智能才会变得更“智能”。