NGMsoftware

NGMsoftware
로그인 회원가입
  • 매뉴얼
  • NGM 6
  • 매뉴얼

    NGM 6

    본 사이트의 컨텐츠는 저작권법의 보호를 받으므로 무단 복사, 게재, 배포 등을 금합니다.

    에디터 외부 API - 구글 API - 비전 AI. (External API, Google API, Vision AI)

    페이지 정보

    본문

    안녕하세요. 엔지엠소프트웨어입니다. 엔지엠 매크로에는 오브젝트 탐지 및 텍스트(글자, 숫자) 인식 기능이 포함되어 있습니다. 오브젝트 탐지는 일반인이 사용하기에 부담스러울 정도로 어려운 부분이 있습니다. 하지만, 비전 AI가 할 수 없는 오브젝트를 탐지할 수 있고, 정확도면에서 우월한 부분이 존재합니다.

    [ 인공지능 딥러닝 오브젝트 탐지 욜로 매치 ]

     

    위의 욜로 매치 액션을 이용하면 정확하게 내가 원하는 이미지를 분석 및 탐지할 수 있고, 오브젝트의 위치까지도 정확하게 알아낼 수 있습니다. 하지만, 비전 AI는 이 부분에서 기능적으로 제약이 존재합니다. 물론, 커스텀 모듈을 이용해서 직접 추가적인 개발을 한다면 욜로 매치와 비슷한 성능을 낼 수 있습니다. 이 부분은 아래 글을 참고 해보세요.

    [ 커스텀 모듈을 이용한 비전 AI 액션 만들기 ]

     

    오브젝트가 아닌 텍스트를 인식하는 기능은 엔지엠 매크로의 [ OCR 체크 ]와 [ OCR 스마트 체크 ]보다 더 뛰어난 성능을 보여줍니다. 다만, 비전 AI는 구글의 API를 사용하기 때문에 추가적인 비용이 발생할 수 있습니다. 자세한 내용은 구글 Vision AI 고객센터에 문의하여 컨설팅을 받으세요.

    [ 구글 Vision AI 고객센터 ]

     

    이 액션을 사용하려면 구글 비전 API를 사용할 수 있도록 사전 준비 작업이 필요합니다. 아래 글을 참고하여 컴퓨터에 인증키를 등록하세요.

    [ 구글 Vision AI 인증키 등록 방법 ]

     

    이제 본론으로 들어가겠습니다. 비전 AI 액션을 사용하려면 위의 내용들을 다 알 필요는 없고, [ 구글 Vision AI 인증키 등록 방법 ]을 참고해서 컴퓨터에 인증키를 등록하면 됩니다. 여기까지 작업이 완료되었다면 엔지엠 매크로 에디터를 실행하고, 새로운 스크립트를 하나 추가하세요.

    cnOuw3h.gif

     

     

    테스트를 위해 아래와 같은 이미지를 하나 다운로드 받았습니다.

    9SUs7vw.png

     

     

    엔지엠 매크로에서 비전 AI 액션을 스크립트에 추가 해주세요.

    USca7kB.png

     

     

    비전 AI 액션의 속성창에서 다운로드 받은 텍스트 이미지를 선택하세요. 감지 옵션은 Text입니다.

    CdJJtT8.png

     

     

    매크로를 실행하면 아래와 같이 결과를 확인할 수 있습니다.

    9V0cg8Z.png

     

     

    아래는 OCR 체크 액션으로 테스트한 결과입니다.

    xYqmN33.png

     

     

    비전 AI

    1. 개요
    ChatGPT(챗GPT)는 GPT-3.5와 GPT-4를 기반으로 하는 대화형 인공지능 서비스이다.

     

    OCR 체크

    ~ 1. 개요
    ChatGPT(HGPT)= GPT-3.52} GPT-48 기 반 으로 하는 대 화 형 인 공 지능 서 비 스 이다.

     

    OCR 스마트 체크

    개요CR』霦P찌렛GP町는 GPT4 5와 GPT-a, 기한의 하는 인공지능 서비스이다.

     

    위 결과를 보면 구글 비전 AI가 OCR 액션들보다 월등히 좋은 성능을 내는 걸 알 수 있습니다. 이번에는 오브젝트를 탐지할 수 있도록 설정을 변경 해보세요. 구글에서 동물을 검색했습니다. 컴퓨터에 저장되어 있는 이미지 선택은 지우고, 탐지할 영역을 선택했습니다. 감지 옵션을 Object로 변경한 후 실행 해보세요. 결과에 강아지(Dog)와 고양이(Cat)로 인식된걸 확인할 수 있습니다.

    2VAndaH.png

     

     

    일반적으로 OCR 체크 또는 OCR 스마트 체크로도 문제 없이 사용할 수 있습니다. 하지만, 왜곡이 심한 텍스트 또는 숫자를 인식하려면 OCR 기능으로는 정확도가 낮다는게 문제입니다. 이런 경우에는 어쩔 수 없이 구글 비전 AI를 사용하시는게 좋습니다. 다만, 추가 요금이 발생할 수 있다는점은 알고 계셔야 합니다.

    [ 비전 AI 테스트 방법 ]

     

    개발자에게 후원하기

    MGtdv7r.png

     

    추천, 구독, 홍보 꼭~ 부탁드립니다.

    여러분의 후원이 빠른 귀농을 가능하게 해줍니다~ 답답한 도시를 벗어나 귀농하고 싶은 개발자~

    감사합니다~

    • 네이버 공유하기
    • 페이스북 공유하기
    • 트위터 공유하기
    • 카카오스토리 공유하기
    추천0 비추천0

    댓글목록

    등록된 댓글이 없습니다.