Notice
Recent Posts
Recent Comments
Link
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
Tags
more
Archives
Today
Total
관리 메뉴

짱이 될거야

2022-09-17(2): Linux에서 py-hanspell 사용하기 본문

Today I Learned

2022-09-17(2): Linux에서 py-hanspell 사용하기

jeong57 2022. 9. 17. 18:48

Linux 환경에서 Ubuntu를 활용해 pyspark를 사용하려고 한다.

python 언어로 제공하는 한글 맞춤법 검사기인 hanspell을 쓰려고 했는데, 계속해서 설치가 되지 않았다.

 

Ubuntu에 설치되어 있는 Python 버전은 3.10.4이다.

 

시행착오들

1. pip를 사용해서 py-hanspell을 설치하려고 했다. : 에러 문구가 뜨면서 설치가 되지 않았다.

pip install py-hanspell

2. 구글링을 하다보니 git clone을 해서 하면 바로 된다고 해서 해봤다.: 계속 feature version에는 "-"를 쓰지 못하기 때문에 경로를 읽을 수 없다는 에러가 뜬다.

# 먼저 git을 설치한다.
$ sudo apt-get install git
$ sudo git clone https://github.com/ssut/py-hanspell.git

$ cd py-hanspell
$ python3 settings.py install

3. Python 버전의 문제인 것 같아서 로컬에 있는 VSCode(Python 3.9.13 version)에서 pip install py-hanspell을 해봤는데, 바로 됐다. -> Ubuntu에 다른 버전의 Python을 깔아보기로 했다.

4. Ubuntu에 Python 3.9.13 버전을 설치했는데, "python3"은 3.10.4 버전을, "python3.9"는 3.9.13 버전을 가리키게 되었다.

  • python3이 가리키는 것이 3.9.13이 되도록 바꿨다.
  • pip install py-hanspell을 하면 계속 3.10.4 쪽에 라이브러리가 설치돼서 python3으로 코드를 돌리면 계속 라이브러리가 없어서 실행시키지 못한다는 말이 뜬다.

5. 새로운 Hadoop 계정을 만들어서 Hadoop부터 Ubuntu까지 다시 설치 후, python 3.9.13 버전도 새로 설치했다.

  • 우분투 upgrade 하는 순간 이미 Python 3.10 버전이 깔린다..
  • python3은 python 3.10.4한테 먹혔다.
  • pip를 쓰려면 먼저 설치를 해야 하는데, 현재 python = python3.9, python3 = python3.10을 가리키는 상황이다.
  • sudo apt install python-pip을 하면 python3.9 쪽에 pip이 설치된다고 생각했는데 아니었다.
  • 무조건 python apt install python3-pip을 해야 한다.

6. (완전 큰 실수) 기존에 설치된 python3을 지워봤다. : 터미널이 까맣게 된 상태로 컴퓨터가 모두 멈추고, 결국 강제종료를 해야 했다. 강제 종료 후 다시 노트북을 켰는데 부팅되는 데에만 체감상 5분 정도 걸려서 죽는 줄 알았다. 구글링 할 때 python 삭제는 무슨 일이 있어도 하면 안된다고 했는데, 이미 경험해본 사람들 말을 들어야 했다.

7. 다시 Ubuntu 계정을 팠다. 이번에는 새로운 python 버전을 설치한다는 희망은 버렸다.

8. py-hanspell을 설치하는 다른 방법이 없나 찾아보다가 새로운 코드를 발견했다.

  • python은 3.10 버전인 채로 두고 sudo apt install python3-pip 까지 진행한다.
  • 아래 코드를 입력하면 버전이고 뭐고 다 상관없이 설치가 끝난다.
  • 참고: https://wikidocs.net/92961
 

10) 한국어 전처리 패키지(Text Preprocessing Tools for Korean Text)

유용한 한국어 전처리 패키지를 정리해봅시다. 앞서 소개한 형태소와 문장 토크나이징 도구들인 KoNLPy와 KSS(Korean Sentence Splitter)와 함께 유용하 ...

wikidocs.net

pip install git+https://github.com/ssut/py-hanspell.git

 

결론

코드 한 줄로 해결 가능한 문제였는데, 빙빙 둘러서 정답만 뺀 모든 방법을 다 시도해본 것 같다.

한 세 번째 계정을 다시 파니까 더이상 할 의욕이 없어졌다.

그래도 Ubuntu와 VMWare에 대해서는 거의 박사가 된 기분..

Ubuntu와 VSCode에서 한글 사용하는 방법, Ubuntu에 python 버전 여러 개를 설치하고 기본 경로 바꾸는 방법 등등을 알았다.

그리고 무슨 일이 있어도 python은 삭제하면 안된다는 걸 배웠다.

Comments