Tractica预测,2024年人工智能市场规模将增长至111亿美元。但AI要真正发挥浸染,优质的数据必不可少,AI公司大约有1/3的钱须要花在数据上,以是,前真个数据采集、加工环节单拎出来成为了新的机会点。36氪曾宣布,“倍赛BasicFinder”与“丁火智能”同为AI数据标注赛道上的选手。
BasicFinder注册成立于2015年,将打字员改造成数据标记员,通过自营模式担保做事质量。现如今,BasicFinder已拥有20家下辖数据工厂近3000名数据操作员,做事了数百家企业客户。而丁火智能采取众包模式进行数据采集及标注,旗下“荟萃APP”目前已积累数十万生动众包用户,日均可处理百万图像及上千小时语音数据。
数据标记是个重人力的劳动密集型行业,这类公司的关键点就在于——职员效率、交付质量。

“当数据任务量大时,比如标记百万级图片,可能须要200人一个月。此时职员的合营管理很是关键,以是,过去一年,BasicFinder紧张在优化系统。”倍赛BasicFinder创始人兼CEO杜霖如是说,从前端采集,系统预处理,赞助标记,到监控数据集,产出模型等,BasicFinder自研发的系统不仅要通过工具提高人工标记的效率,而且更适配于企业对AI数据的全生命周期管理需求。
杜霖还透露,凭借这套系统,BasicFinder在某银行招标时,PK掉了其他竞争对手。
“而本次收购,紧张是双方模式互补。工厂模式质量相对更可控,但本钱偏高,众包模式则可以实现更低本钱及多样性、大样本的数据采集与标注做事。以及,丁火智能研发的众包策略模型及质量监控引擎,可达到多人拟合准确率超过98%。”
之后,倍赛BasicFinder将保留并独立运营荟萃APP品牌。客户可以在荟萃的管理后台自由发布任务,如数据采集、标注或调查问卷,实时监控任务实行情形及动态调度价格方案。荟萃也支持API调用的办法将数据做事接入客户现有的AI系统,实现数据与模型的人机协同迭代。
推举阅读:
《人工智能大火,BasicFinder要做数据采集、加工的“送水人”》
《从数据标注切入的「丁火智能」,未来想做的是线上人力平台》