반응형
이 자료는 한국인공지능협회에서 진행한 2021년 사업주 직업능력 개발훈련으로 BASIC AI(32시간)-박성주 강사의 온라인 교육내용을 참고한 것입니다.
데이터 레이블링
- 인공지능(AI)는 잘 만들어진 데이터가 필요하다.
- AI 프로젝트에 소요되는 시간 비율?
- 데이터 식별 5%, 데이터 수집 10%, 데이터 정제 25%, 데이터 라벨링 25%, 데이터 증강 15%
- AI 알고리즘 개발 3%, AI 모델 학습 10%, AI 모델 조정 5%, AI 서비스 배포 2%
빅데이터와 레이블링
- Bounding Boxes
- Image Segmentation
- Tagging of Image Elements
- Face Marking with Points
라벨링 환경구축
<라벨링 프로그램 설치 및 실습>
- 샘플 이미지를 다운로드해야한다.
- 강아지와 고양이가 같이 있는 사진 : 3장(jpg file)
- C:/ai_exam 폴더에 이미지 3장을 다운로드
- 아나콘다 실행: p37 계정으로 사용(주피터에서 돌아가고싶다면? ctrl+c)
- [시작]-anaconda3(64-bit) - anaconda prompt 실행
- conda activate p37
- 데이터레이블링 프로그램 받기
- labeling 프로그램 받기
- (p37) C:\ai_exam>pip install labelimg
- labelimg 프로그램 실행
- (p37) C:\ai_exam>labelinmg
5. 주의할 사항
- 데이터 라벨링시에 순서가 필요
0-> 고양이(cat)
1-> 강아지(dog)
Pascal/VOC 로 저장하면 .xml로 저장됨
YOLO 로 저장하면 .txt로 저장됨
CreateML로 저장하면 .json으로 저장됨
한 번 레이블할 때, 세가지 방식으로 모두 저장해놓는 것이 좋다
반응형
'그냥, 코딩' 카테고리의 다른 글
티처블머신(Teachable Machine) X 인공지능키트(AIIT,에이토) (0) | 2021.12.15 |
---|---|
인공지능설계 - 인공지능 6단계 학습 및 예제 실습 (0) | 2021.12.15 |
티처블머신(Teachable Machine) 소개 및 실습 (0) | 2021.12.15 |
크롤링(Crawling) (0) | 2021.12.14 |
인공지능 알고리즘 분석 방법 - jupyter 활용 (0) | 2021.12.14 |