數據是人工智能的基礎。小到智能手機人臉解鎖,大到智慧城市的智能安防;從車輛自動駕駛到AI聊天機器人,從醫(yī)學成像與診斷到農作物監(jiān)測。AI需要依據大量有效數據總結規(guī)律形成“智能”,進而在不同場景下落地應用。
“其實AI數據作為生產資料,是推動整個AI行業(yè)發(fā)展的必要一環(huán),也是人工智能商業(yè)化的主要驅動力之一,說高質量的數據決定了AI的落地程度也不為過?!痹茰y數據總經理賈宇航表示。
目前,場景化AI數據是人工智能現階段發(fā)展和商業(yè)化落地的關鍵點。但機器并不能理解人類所能識別的原始數據,這些原始數據需要人為的“標簽化”以后,才可以被用于模型訓練。這些“標簽化”的數據越多越精準,其獲得的結果就越準確。例如,自動駕駛的算法模型經過大量場景AI數據的訓練,不斷的學習和優(yōu)化,進而讓系統(tǒng)的智能化程度逐漸提高。
如何“標簽化”就涉及“數據標注”這一環(huán)節(jié),即針對語音、圖像、文本等數據,通過貼標簽、做記號、標顏色或劃重點的方式,來標注出其中目標數據的不同點、相似點或類別。
數據標注,是將數據轉化為AI商業(yè)價值的重要一環(huán)。數據標注的精準度越高,AI學習和產出的結果越精確,AI也就越智能。
在場景化落地中,意味數據標注行業(yè)要滿足多樣化應用場景標注需求。例如,金融行業(yè),早期對AI客服機器人的要求只停留在“用戶提問后,對其中的關鍵詞進行提取,并按照既定話術回答”。但在互聯網金融業(yè)務競爭異常激烈的今天,越來越多的用戶習慣在網上辦理業(yè)務,AI客服機器人正在大規(guī)模地取代人工客服,AI問答的準確性將直接決定業(yè)務的效率和成本,并影響用戶體驗,很大程度上決定了金融機構的競爭力。(王雨陽)
相關資訊