從流體標註看數據標註未來的發展方向
眾所周知,數據是人工智能的核心之一,然而,剛剛採集的原始數據機器是無法對其進行直接學習的,這時便需要數據標註師對其進行標註,方能成為機器學習的“原料”。在此背景之下,數據標註產業隨之發展起來,成為“人工智能背後重要的人工”。隨著行業的發展,數據標註逐漸開始發生產業轉變,悄然向“技術化”轉型。那麼未來,數據標註發展的方向又在何處呢?
前一段時間,谷歌在其AI博客上介紹了一款基於AI和深度學習的圖像標註方式——“流體標註”,它使用機器學習來註釋類標籤並勾勒出圖片中的每個對象和背景區域。可作為人工標註者的有力輔助工具,谷歌聲稱它可以將標記數據集的速度提高三倍,有望緩解目前機器學習研究中,高質量的訓練數據獲取難的瓶頸。
流體標註從預訓練的語義分割模型的輸出開始,該模型生成大約1,000個具有類別標籤和置信度分數的圖像片段,其中具有最高置信度的片段將被傳遞給人類工作者以進行標記。註釋器可以通過儀表板修改圖像,選擇要更正的內容和順序,將現有細分的標籤與自動生成的短名單進行交換,添加細分以覆蓋缺失的對象,移除現有細分或更改重疊細分的深度順序。
流體註釋是使圖像註釋更快更容易的第一個探索性步驟,在未來的工作中,流體標註將通過改進對象邊界的註釋,擴展界面來處理以前看不見的類,從而實現更高效的數據標註。
雖然這種方式尚未落實到具體工作之中,但仍是值得期待的一項技術。並且在國外,谷歌並不是唯一一個將AI應用於數據標註的公司。
由此可見,科技化的數據標註方式必將成為數據標註的重要發展方向。那麼數據標註中的人工會被取代麼?答案顯然是否定的。但是基礎職能的轉型則是行業發展的必然。未來,數據標註行業對人才的大量需求將轉向專業化。AI優評聯合權威部門,為數據標註人才的專業化培養邁出了堅實的一步,通過科學的考評制度,AI優評將為考核通過的人才頒發國家職業資格培訓鑑定實驗基地統一核發的《人工智能技術服務-數據標註與審核》高新技術能力證書,以此為行業建立起一個科學的準入制度與人才評價標準,為行業的發展做出自己的貢獻。
轉載請超鏈接註明:頭條資訊 » 從流體標註看數據標註未來的發展方向
免責聲明 :非本網註明原創的信息,皆為程序自動獲取互聯網,目的在於傳遞更多信息,並不代表本網贊同其觀點和對其真實性負責;如此頁面有侵犯到您的權益,請給站長發送郵件,並提供相關證明(版權證明、身份證正反面、侵權鏈接),站長將在收到郵件24小時內刪除。