본문 바로가기
공부/python

[Pytesseract를 사용한 메이플스토리 길드 스코어 분석] 필요한 라이브러리 설치

by 고기 2022. 3. 27.

코드를 설명하기 전에 우선 설치해야 할 라이브러리들이 몇 개 있다. 일단 이 글에서는 4개의 라이브러리만 설치하는 것을 다루지만, 자신의 컴퓨터에 없는 라이브러리가 있다면 검색해서 추가로 인스톨 하면 된다.

 

설치해야 할 라이브러리는 다음과 같다.

'''
라이브러리 설치
1. openpyxl
2. pyautogui
3. opencv-python
4. pytesseract
'''

!pip install openpyxl
!pip install pyautogui
!pip install opencv-python
!pip install pytesseract

 

이런식으로 설치해주면 된다.

사진1

 

사실 인스톨 하는 것 자체는 별 게 없는데 굳이 글을 쓰는 이유는 pytesseract 라이브러리 때문이다. pytesseract는 이미지를 텍스트로 변환해주는 라이브러리로, 사용하려면 인스톨 외에도 아래 링크에서 tesseract 프로그램을 추가로 설치해야 한다.

https://github.com/UB-Mannheim/tesseract/wiki

 

GitHub - UB-Mannheim/tesseract: Tesseract Open Source OCR Engine (main repository)

Tesseract Open Source OCR Engine (main repository) - GitHub - UB-Mannheim/tesseract: Tesseract Open Source OCR Engine (main repository)

github.com

 

나는 컴퓨터 사양에 맞춰 64비트로 다운받았는데, 본인 컴퓨터가 32비트라면 그에 맞춰 파일을 다운로드 하면 된다.

사진2

 

다운로드 받은 설치파일을 실행시킨 다음, 따로 설정해줄 필요 없이 하란대로 설치해주면 된다. 물론 이 다음에 설명할 프로그램의 경우 숫자만 사용할 거라서 설정이 필요없다는 말이고, 언어를 변환하려는 거면 추가로 언어 데이터를 골라서 받아주면 된다.

 

사진3

 

사진4

 

사진5

 

사진6

 

사진7

 

사진8

 

사진9

 

사진10

 

여기까지 tesseract-OCR 설치를 완료한 다음 환경변수를 설정해주면 되는데, 가끔 파이썬에서 tesseract 경로를 찾지 못하는 문제가 있다. 환경변수를 설정해줘도 못 찾는 경우가 종종 보이는 것 같은데, 이럴때는 그냥 python에서 경로를 직접 설정해주면 문제없이 깔끔하게 실행할 수 있다.

import pytesseract as pyt

pyt.pytesseract.tesseract_cmd = R'C:\Program Files\Tesseract-OCR\tesseract.exe'
pyt.image_to_string('./test.png')

 

test.png를 읽어온 모습이다.

사진11

 

여기까지 라이브러리 설치에 대해 알아보았다. 다음 글에서는 프로그램 UI 작성 방법과 어떤 함수들을 작성할 것인지에 대해 다뤄본다.

 

댓글