推荐一本免费的在线电子书,《用Python进行自然语言处理》, 用NLP 工具包(开源免费,Python)来进行文本分析。特别适合初学计算语言学的学生。好像没有好的中文切词。当然,免不了需要提一下 Dan Jurafsky 教授,大家可以搜索一下,找找他的讲义。

简要翻译一下提纲:

(书的主站点:http://www.nltk.org/

  • 序言
  • 用Python进行语言处理
  • 使用文本语料库和辞典资源
  • 处理原始文本
  • 结构化变成
  • 词语的分类和标签
  • 学习文本分类
  • 从文本中信息抽取
  • 分析句法结构
  • 创建基于特征的语法
  • 分析句子的意思
  • 管理语言学数据
  • 后记:直面语言带来的挑战

Natural Language Processing with Python
— Analyzing Text with the Natural Language Toolkit

Steven Bird, Ewan Klein, and Edward Loper

0. Preface (extras)
1. Language Processing and Python (extras)
2. Accessing Text Corpora and Lexical Resources (extras)
3. Processing Raw Text
4. Writing Structured Programs (extras)
5. Categorizing and Tagging Words
6. Learning to Classify Text (extras)
7. Extracting Information from Text
8. Analyzing Sentence Structure (extras)
9. Building Feature Based Grammars
10. Analyzing the Meaning of Sentences (extras)
11. Managing Linguistic Data
12. Afterword: Facing the Language Challenge