본문 바로가기

컴퓨터 관련정보

pdf 텍스트 추출하는 방법

반응형


PDF나 이미지 파일에 있는 텍스트를 옮겨 적어야 할 때가 있는데요. 저 같은 경우에는 쇼핑몰 상세페이지를 만들 때 주로 사용하고 있습니다. 한글이나 영어는 비교적 따라 쓰거나 번역할 수 있는데, 중국어는 번역 자체가 힘들더라구요. 그래서 이미지 파일이나 PDF 텍스트 추출한 후 번역하고 있습니다.



저는 텍스트 추출을 위해 구글 드라이브를 이용하고 있습니다. 먼저 구글 드라이브에 접속합니다.

▶구글 드라이브 바로가기



구글 드라이브에 접속한 후 화면 빈 화면에서 마우스 오른쪽 버튼을 누릅니다. 그다음 파일 업로드를 클릭합니다.



불러올 파일을 선택한 후 열기를 누릅니다. 작년에 여행을 다녀왔던 곳에서 찍은 푯말로 텍스트 추출을 시도해 봤습니다.



사진이 업로드되면 표시가 되는데요. 사진에 마우스 커서를 올려놓고 우클릭을 합니다.

그런 다음 연결 앱->Google 문서를 클릭합니다.



구글 문서에서 텍스트가 추출된 모습인데요. 화질이 좋은 편이 아니라 완벽하진 않지만, 텍스트가 잘 추출 되었습니다. 좀 더 글씨를 알아볼 수 있는 사진이면 더 좋을 것 같습니다. 사진뿐만 아니라 PDF 파일에도 적용할 수 있습니다.




이제는 손으로 직접 타이핑을 하지 않아도 글씨가 추출되는 세상이네요. 여행 정보나 옮겨 적고 싶은 글귀를 사진찍어서 남겨 놓으면 쉽게 추출할 수 있을 것 같네요.