2011년 10월 23일 일요일

[책소개] Python Text Processing by Jeff McNeil


이 책을 소개해 드립니다.

내용이 상당히 많은 부분을 다루고 있고, 텍스트 프로세싱이라는 것이 별거 아닌거 같지만,

제대로 할려면 만만한 부분은 아니라고 생각합니다.

이 책에서 소개하고 있는 내용은 기본적인 I/O핸들링 부터 시작해서,


  • python에서 기본제공하는 라이브러리 사용
  • CSV read/write, json 파일 포맷
  • Regular expression (정규표현식이라고도 하죠)
  • Mark up Language (XML, HTML) handling 
  • 템플릿 (여기서는 mako template을 소개합니다), 
  • 유니코드 , 인코딩. 디코딩
  • 아웃풋 포맷팅(pdf, excel, odf)
  • parsing, NLTK 
이런 주제들을 다루고 있습니다. 

제가 보니깐, 저 위에 나열된 작업들은 보통 일반적으로 끼고 사는 경우가 많습니다. 

시간 소비도 많고요,  위에 있는 아이템만 제대로 하셔도 , 

일찍 퇴근하는데 많은 도움이 됩니다. 

저런것들은 어디서 따로 가르쳐주는데도 없고 하는데, 

정말 내용구성은 좋은거 같습니다. 깊이는 들어가지 않더라도, 한번씩 훑어주므로, 

정작 필요할때는  advanced 하게 들어갈수 있도록 길잡이 역할을 하는 책입니다. 





댓글 없음:

댓글 쓰기