no image
[OCR] 광학 문자 인식 기술 (2)
ocr 여러가지 테스트 중~ 1. Tesseract2024.07.07 - [Study/비전] - [OCR] 광학 문자 인식 기술 (1) [OCR] 광학 문자 인식 기술 (1)우와!지난 realtime object detection model을 이용한 시각장애인 음성안내 카메라 서비스 플젝을 마무리하고이젠 비전 안봐~ 했는데 어쩌다보니 비전 카테고리에 글을 쓸일이 생겼네요..ㅋㅋㅋㅋ 원래greenjade.tistory.com   2. Easy OCRhttps://github.com/JaidedAI/EasyOCR?tab=readme-ov-file GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular wr..
2024.07.12
no image
[OCR] 광학 문자 인식 기술 (1)
우와!지난 realtime object detection model을 이용한 시각장애인 음성안내 카메라 서비스 플젝을 마무리하고이젠 비전 안봐~ 했는데 어쩌다보니 비전 카테고리에 글을 쓸일이 생겼네요..ㅋㅋㅋㅋ 원래 인생이 그렇지 머 ~~    광학 문자 인식 (Optical Character Recognition;OCR)은 입력/ 필기 / 인쇄된 텍스트 '이미지'를 기계가 읽을 수 있는 인코딩된 '텍스트'로 변환하는 데 사용되는 기술이다.즉,  input = 이미지 / output = 텍스트 OCR을 하기 위해서 어떤 api 또는 파이썬 라이브러리를 사용할 수 있는지 조사해봤다. 내가 사용할 input 이미지는 겨울방학에 비타민에서 진행된 시계열 프로젝트의 발표 ppt이다.   1. Tesseract ..
2024.07.07
no image
[Object Detection] R-CNN
논문 : Rich feature hierarchies for accurate object detection and semantic segmentation [Tips] - 이미지 분류 task에 ImageNet이 있다면, 객체 탐지 task에는 PASCAL VOC이 있다. (Visual Object Classes) - mAP : mean Average Precision : 객체별 AP의 평균값으로 객체 탐지 task에서 대표적으로 사용되는 metrics 중 하나 - 2012년 이미지넷 대회에서 CNN이 이미지 분류 task에서 우수한 성능을 보임 [Question] "CNN으로 객체 탐지 task에서 좋은 성능을 낼 방법이 없을까?" [ 위 문제를 해결하기 위한, 2가지 새끼 문제들] (문제 1) 그 CN..
2024.03.26
no image
CV Tasks에 대하여
출처 : https://www.youtube.com/watch?v=nDPWywWRIRo&list=PLC1qU-LWwrF64f4QKQT-Vg5Wr4qEE1Zxk&index=12 http://cs231n.stanford.edu/schedule.html 컴퓨터 비전 태스크는 다양하게 존재하고, 그 중 가장 코어하고 전통적인 태스크는 분류일 것이다. 위 강의에서는 이 외의 다양한 task에 대해서 알아보고자 한다. 목차는 다음과 같다. 1. Semantic Segmentation 2. Object Detection 3. Instance Segmentation 4. Beyond 2D Object Detection... 이 글에서는 각 task를 수행하기 위한 방법들, 모델에 대한 개괄을 정리한다. 1. Seman..
2024.03.14