1. 程式人生 > >如何運營一家數據標註公司 (資源特點篇)

如何運營一家數據標註公司 (資源特點篇)

建立 沒有 基本 結果 企業 圖片 競爭力 成本 快速

在“基礎架構篇”中我們提到的資源,也就是數據標註公司要面對的甲方:AI公司、AI企業、AI研究所。那麽問題來了,人工智能公司、人工智能企業、人工智能研究所多種多樣,作為一個數據標註公司應該如何定義自己的服務方向呢?

首先我們要能夠準確的了解資源公司的特點,這樣才能更好的為其提供符合自身特點的服務。
技術分享圖片
目前市場上的AI公司、AI企業、AI研究所大致分為以下幾種,對於與數據標註公司的合作來說他們各有各的優勢和劣勢,這裏對以下突出的幾類進行分析:

1. 初創型
這裏指的初創型公司一般指未進行過階段融資的初次創業型公司。
優勢:
a) 溝通成本低初創型公司的核心創始人一般都是公司的核心技術人員,所以他們對數

據標註的結果有清晰的需求認知,能夠清楚嚴謹的表述出需要標註數據的規則,數據標註公司與此類資源公司在溝通上比較簡單,能夠快速的直入主題,迅速建立供需關系,省去冗長的上報、各級的批復等溝通環節。
b) 結算時間快這類資源公司本身公司架構也相對簡單,對於標註完成後的結款時間相對也較短。
劣勢:
a) 需求連貫性不強因為初創型公司很多沒有穩定的甲方,同時公司在同一時期對接的甲方數量並不是一定的,有可能在某個月中會有很多,同樣也可能一個沒有。這就導致了在數據的需求連貫性上並不是很強。
b) 標註需求量不大在與甲方溝通合作的路上,展示型項目產品並不需要大量數據的驗證。更多時候都是以小批量數據進行產品的小樣展示,因為初創公司也要考慮項目的成功率和標註成本之間的關系。

2. 企業型
這裏指已經形成一定規模的人工智能企業,同時可能已經獲得多輪融資。
優勢:
a) 數據連貫性強這裏指的一定規模的人工智能企業可能已經是市場上第一梯隊的領跑者,因為有成熟的產品和合作對象,其在產品需要進行叠代和研發關聯產品時是需要大量標註數據作為模型訓練的。同時因為其在業界的影響力,與新的需求商進行合作時的成單率也要遠高於初創AI公司。
b) 數據價值高因為大型公司需要綜合保密、質量、工期等多方面因素,同時因為已經與需求公司建立了正式的合作關系,此類型的AI公司在提供的數據標註單價上是要略高於初創型企業。
劣勢:
a) 結算周期長因為此類公司的結構相對復雜,同時結構越復雜的公司其對於支出資金的流程也越謹慎,這種謹慎就會導致合同內的結款周期遠遠高於初創型企業。

b) 溝通成本高因為此類公司的架構相對復雜,一般一個項目的啟動流程是“算法團隊將需求提供給項目經理,項目經理聯系數據標註公司試標-數據標註公司試標完畢反饋-項目經理檢查並反饋給算法團隊”。這其中就避免不了多人傳達規則時出現的模糊情況,需要大量的時間進行溝通和驗證。同時在項目啟動時的流程也相對復雜,不僅需要算法確認規則,需要財務確認支付方式,需要法務進行合同審核,需要項目主管領導批準,這些都會使數據標註公司的溝通成本大大增加。

3. 科研型
這裏指各類政府、大學等行政事業單位的科研部門。
優勢:
a) 結算時間短一般的科技機構的審批方式都是先進行項目報備,在項目報備通過的時候其實這部分的項目資金就已經預留出來了,只要數據標註公司能夠按時按量的完成項目內容同時提供合同內規定的相關發票,就可以順利結算。
b) 溝通成本低一般的科研機構都是由項目負責導師指定聯系人進行與數據標註公司的溝通,同時被指定人一般也都是項目的參與人,所以在規則的制定上更為清晰,與初創公司一樣,能夠快速的進入主題,大大節省了數據標註公司在溝通方面所花費的時間。
劣勢:
a) 數據連貫性不強因為此類科研所的項目基本都是階段性的,一類產品上線後,相關產品再進行上線需要周期。
b) 找尋成本高因為科研機構的特殊性,在市場上很難準確就定位到需求部門,在眾多部門中確立需求部門並與之建立起合作關系是需要耗費大量的時間和精力。

4. 綜合型
向AI化轉型的各類傳統行業企業。
優勢:
a) 數據連貫性強因為涉及傳統生產的轉型,該類企業一般都有獨立的AI產品研發組,同時因為此類公司本身的體量和市場占有率,會使其對於需要轉型的領域和需求產品更為寬泛。
b) 數據量大因為AI轉型除了成熟的技術支撐之外,最重要的就是時間,越快將生產結合AI的企業,其市場競爭力也就越明顯。而如何能讓計算機快速的進行訓練呢?除了算法團隊的技術支撐,剩下的就是給計算機提供大量的符合模型識別的標註數據。
劣勢:
a) 結算周期長和企業型公司性質相同,由於龐大的內部結構,項目資金的結款周期相較於初創型公司和研究所會大大增長。
b) 工期緊張因為有轉型這個宏觀任務,所以一般此類企業都對轉型項目的落地時間有明確的規定,說簡單一些就是工期緊、任務重。由於這種特點,數據標註公司在承接此類公司的項目時,需要有大量的人手進行數據標註,這對於公司本身的管理無疑也是巨大的挑戰。

本文所說的每種公司都有各自的渠道獲取特點,請持續關註博客,我們會在接下來更新更多的相關內容。

了解更多請進入:http://www.awkvector.com/

如何運營一家數據標註公司 (資源特點篇)