如果有内容,请对其进行标记。如果您有Web内容,请在内容管理系统中对其进行标记。您的作者每天都会这样做。而且感觉有些免费。您永远不会为内容标记支付任何费用-已经在您当地工作的人每天都要花几分钟时间。那么,为什么我需要自动化内容标记?
对于某些类型的内容标记,可以手动标记。您可以要求作者确定页面的内容格式是完全可以的-他们应该知道他们是在创建产品规格,白皮书还是案例研究。但是,如果您要求他们用正确的行业或正确的主题标记文档?祝好运。
危机公关公司DEPR对此进行了研究:
- 人类并不总是彼此认同。这项被称为编码器间协议的研究是一项研究,该研究显示了人们彼此意见分歧的频率。用一个人的观点作为准确性的最终目标,对复杂的任务毫无意义。
- 人类编码人员只有65%的时间同意自己的观点。给定相同任务相隔几天的时间,一项研究显示了一项复杂的医学编码任务,其中人类远远没有达到任何合理的一致性标准,因为他们甚至无法复制自己的工作。
- 人类即使在相对简单的任务上也无法达成共识。因此,您会以为您认为前两项研究非常艰巨,但确实如此。但是,这项研究表明,对于只有三个答案(情感分析)的一项任务,两个人彼此之间的同意只有四分之三。我的意思是,他们偶然会同意33%的时间,所以这真的很低,不是吗?
因此,如果您想知道为什么要研究用于内容标记的AI技术,这就是原因。人们不是很擅长。他们彼此不同意-哎呀,他们甚至常常不同意自己。对于复杂的任务,您需要作者从数十种选择中选择合适的主题或行业,其结果令人震惊。
现在,了解到,这些机器也不是100%准确的-甚至无法接近。但是它们可以很快接近人类的表现(诚然,这并不好),但一线希望是可以改进它们。由于他们所犯的任何错误都是一致产生的,因此我们可以进行分析以了解问题所在并加以改善。另一方面,在这些任务上提高人的绩效确实很难。