๐ Paper: http://vision.stanford.edu/pdf/bbox_submission.pdf
crowdsourcing์ ์ด์ฉํ bounding-box annotation system์ ๋ํด ๋ค๋ฃจ๋ ๋ ผ๋ฌธ์ด๋ค. (์คํ ํฌ๋ Fei-Fei ๊ต์๋ ์ฐ๊ตฌ์ค ๋ ผ๋ฌธ!) ํ์ฌ์์ crowdsourcing ์ฌ์ ์ ์งํํ์ด์ ์ฝ์๋ ๋ ผ๋ฌธ์ด๋ค.
1. Introduction
bounding box annotation์ crowd-source ํ๊ธฐ ์ํ fully automated, highly accurate, cost-effective ํ ์์คํ
Requirements
- quality - ๊ฐ bbox๋ tight ํด์ผ ํ๋ค.
- coverage - ๋ชจ๋ object๋ bbox๋ฅผ ๊ฐ์ ธ์ผ ํ๋ค.
cost-effective(ํ์ง์ ๋ณด์ฅํ๋ฉด์ ๋น์ฉ์ ์ต์ํ) ํ ๋ฐฉ๋ฒ์ผ๋ก high quality์ complete coverage๋ฅผ ๋ฌ์ฑํ๋ ๋ฐฉ๋ฒ์?
Three sub-tasks
ํ ์์ ์๊ฐ bbox๋ฅผ ๊ทธ๋ฆฌ๊ณ , ๋ค๋ฅธ ์์ ์๊ฐ bbox์ ํ์ง์ ํ์ธํ๊ณ , ๋ ๋ค๋ฅธ ์์ ์๊ฐ ๋ชจ๋ object๊ฐ bbox๋ก ํ์๋์๋์ง ํ์ธํ๋ ๋ฐฉ๋ฒ
- drawing: ์ด๋ฏธ์ง์์ ํ๋์ ๋ฌผ์ฒด์ ๋์ํ๋ ํ๋์ bbox๋ฅผ ๊ทธ๋ฆฐ๋ค.
- quality verification: bbox๊ฐ ์ฌ๋ฐ๋ฅด๊ฒ ๊ทธ๋ ค์ก๋์ง ํ์ธํ๋ค.
coverage verification: ๋ชจ๋ object์ bbox๊ฐ ๊ทธ๋ ค์ก๋์ง ํ์ธํ๋ค.
verification ๊ณผ์ ์ binary answer๊ฐ ํ์ํ๋ฏ๋ก ์ด๋ฏธ ์ ์๋ ค์ง majority voting๊ณผ ๊ฐ์ ๋ฐฉ๋ฒ์ ์ ์ฉํ ์ ์๋ค.
2. Approach
Work Flow
- drawing task: ํ๋์ object์ ๋์ํ๋ ํ๋์ bbox๋ฅผ ๊ทธ๋ฆฐ๋ค. (ex. raccoon)
- worker training (rules)
- all visible part & as tightly as possible
- include only one
- new instance
- check the check box when completed
- qualification test
- rule์ ์ ๋๋ก ์์งํ๋์ง ํ ์คํธ ์ด๋ฏธ์ง ์ ์ ํตํด์ ํ์ธ ํ instant feedback์ ์ ์กํ๋ค.
- ์ถฉ๋ถํ tight ํ์ง ์์ / solicited object๊ฐ ์๋ / ์ด๋ฏธ bbox๊ฐ ์๋ object ์
- ๊ทธ ํ ์ค์ ์ด๋ฏธ์ง์์ ์์ ํ ์ ์๋ค.
- worker training (rules)
- quality verification task: ์๋กญ๊ฒ ๊ทธ๋ ค์ง bbox์ quality๋ฅผ ์ธก์ ํ๊ณ good bbox๋ DB์, bad bbox๋ ๋ฒ๋ฆฐ๋ค.
- ์์ ์๊ฐ ์ง์คํ ์ ์๋๋ก ์ด๋ฏธ์ง ๋น ํ๋์ bbox๋ง์ ๋ณด์ฌ์ค๋ค.
- worker training (rules)
- include an instance of the required object
- all visible part & as tightly as possible
- include only one
- qualification test
- quality control (gold standard)
- good bbox๋ฅผ bad๋ก, bad bbox๋ฅผ good๋ก ํ๊ฐํ๋ ๊ฒฝ์ฐ๋ฅผ ๋ฐฉ์งํ๊ธฐ ์ํจ์ด๋ค.
batch์ ์ผ๋ถ ํฌํจ๋๋ validation images๋ฅผ ์์ ์๊ฐ ์ฌ๋ฐ๋ฅด๊ฒ ํ๊ฐํด์ผ ์์ ๋ด์ญ์ด accept ๋๋ค.
validation image๋ฅผ ์ํ good & bad bbox๋ฅผ ์ป๋ ๋ฐฉ๋ฒ
- bad bbox๋ good bbox๋ฅผ ๋ณํํด์ ์์ฑํ ์ ์๋ค.
- good bbox๋ majority voting์ ํตํด ๋ชจ์ ์ ์๋ค.
- ํน์ object๋ฅผ ํฌํจํ๋ image์์ ์ผ๋ถ๋ฅผ ์ํ๋งํ๊ณ bbox๋ฅผ ์ป๋๋ค.
- ์ฌ๋ฌ ์์ ์๋ค์ด bbox์ ํ์ ์ ๋งค๊ธฐ๊ณ , strong consensus(at least 3 workers)๊ฐ ์๋ ๊ฒ๋ค์ โgold standardโ๋ก ์ ์ ํ๋ค.
- coverage verification task: raccoon์ ํด๋นํ์ง๋ง ์์ง bbox๋ก ํ์๊ฐ ๋์ง ์์ object๊ฐ ์๋์ง ํ์ธํ๊ณ , ๋ชจ๋ ํ์๊ฐ ๋์์ผ๋ฉด ์๋ฃํ๋ค.
- ๋ชจ๋ instance๊ฐ bbox๋ฅผ ๊ฐ์ง๊ณ ์๋์ง ํ์ธํ๋ค.
- ๊ฐ์ object๋ฅผ ํฌํจํ๋ ์ด๋ฏธ์ง๋ค์ด ํ ๋ช ์ annotator์๊ฒ ๋ฐฐ์ ๋๋ค.
- ๋ง์ฐฌ๊ฐ์ง๋ก worker training, qualification test๋ฅผ ์ํํ๋ค.
- quality control
- ๋ ์ข
๋ฅ์ validation images๋ฅผ ์ฌ์ฉํ๋ค.
- completely covered๋ majority voting์ ํตํด ์์ฑํ ์ ์๋ค.
- ๊ทธ๋ ์ง ์์ ๊ฒ์ bbox์ subset์ ์ง์ฐ๋ ๋ฐฉ๋ฒ์ผ๋ก ์์ฑํ ์ ์๋ค.
- ๋ ์ข
๋ฅ์ validation images๋ฅผ ์ฌ์ฉํ๋ค.
- ๋ชจ๋ raccoon์ด bbox๋ก ํ์๋ ๋๊น์ง ๋ฐ๋ณตํ๋ค.
Two principles
- simple (draw only one bbox)
- have a fixed and predictable amount of work
3. Experiments
20,000๊ฐ์ ์นดํ ๊ณ ๋ฆฌ๋ฅผ ๊ฐ์ง ImageNet ๋ฐ์ดํฐ์ ์์ 10๊ฐ์ ์นดํ ๊ณ ๋ฆฌ๋ฅผ ์ ์ ํ์๊ณ , ๊ฐ ์นดํ ๊ณ ๋ฆฌ ๋น 200๊ฐ์ ์ด๋ฏธ์ง๋ฅผ randomly sample ํ์๋ค.
Overall quality
- image level: 97.9% images๊ฐ completed covered
- bbox level: 99.2% bboxes๊ฐ accurate
- ํด๋น ์์คํ ์ ํตํด highly accurate bbox๊ฐ ์์ฑ๋์๋ค.
Overall cost
cost = ์์ ์๊ฐ ์๋นํ ์๊ฐ
drawing task๊ฐ quality/coverage verification task ๋ณด๋ค 2๋ฐฐ ์ด์ ์ค๋ ๊ฑธ๋ฆฐ๋ค.
verification task์ ๊ฒฝ์ฐ, binary answer๋ง ํ์๋ก ํ๊ธฐ ๋๋ฌธ์ด๋ค.
ํด๋น ์์คํ ๊ณผ consensus based ๋ฐฉ๋ฒ์ cost ๋น๊ต
ย our approach consensus based approach how expensive mean 88.0 sec 116.9 sec 32.8% median 42.4 sec 58.8 sec 38.9%
Quality control
- drawing task: quality verification task๋ฅผ ํตํด control
- acceptance ratio = 62.2%
- quality verification task: majority voting ๋ฐฉ๋ฒ์ ์ด์ฉํ โgold standardโ๋ฅผ ํตํด control
- validation images๋ฅผ ๋์์ผ๋ก performance๋ฅผ ํ๊ฐํ๋ค.
- acceptance ratio = 89.9%
- coverage verification task: quality verification task์ ๋น์ท
- validation images๋ฅผ ๋์์ผ๋ก performance๋ฅผ ํ๊ฐํ๋ค.
- accpetance ratio = 95.0%
drawing task๋ ๋ time consuming ํ ๋ฟ๋ง ์๋๋ผ ๋ difficult ํ๋ค.
Effectiveness of worker training
drawing task์์ worker training ๊ณผ์ ์ ์ญ์ ํ์์ ๋์ ๋นํด worker training ๊ณผ์ ์ ์งํํ ๋์ quality verification acceptance๊ฐ 4.2% ๋์๋ค.