作者:閑魚技術(shù)-楚豐
在 UI2CODE
項目中,我們大量使用了深度學(xué)習(xí)方法來做一些物體檢測。而深度學(xué)習(xí)模型的訓(xùn)練,避免不了需要大量的樣本,因此如何制造大量樣本,來滿足模型訓(xùn)練需要是我們必須要解決的一個問題。在這篇文章中,我們將介紹我們?nèi)绾卫霉ぞ?,批量泛化出大量樣本,為模型?xùn)練提供數(shù)據(jù)保障。
1.樣本現(xiàn)狀
我們的模型要解決的問題是在一個設(shè)計稿圖片上識別出基礎(chǔ)控件等信息,包括位置和類別。而它所需要的樣本,主要存在兩個問題:
* 數(shù)據(jù)量少:
一個APP的頁面是有限的,特別是針對單個APP做優(yōu)化適配的時候,頁面的數(shù)量是相對較少的,可能在幾十到上百個。而模型的對樣本數(shù)量的需求是巨大的,特別像較為復(fù)雜的模型,對數(shù)據(jù)量的要求至少是萬級別的,單靠真實樣本,是遠遠達不到要求的。
* 標(biāo)注成本高:物體檢測的樣本標(biāo)注,不僅需要標(biāo)注物體的類別,更需要標(biāo)注出物體的具體位置
熱門工具 換一換