1.1 Bắt đầu với Python
Một trong những điều thân thiện về Python là nó cho phép bạn gõ trực tiếp vào dịch viên tương tác - chương trình sẽ được chạy chương trình Python của bạn. Bạn có thể truy cập các thông dịch Python sử dụng một giao diện đồ họa đơn giản được gọi là môi trường phát triển tương tác (IDLE). Trên máy Mac, bạn có thể tìm thấy điều này ứng dụng dưới → MacPython, và trên Windows All Programs → Python. Dưới Unix bạn có thể chạy Python từ vỏ bằng cách gõ nhàn rỗi (nếu điều này không được cài đặt, hãy thử gõ python). Thông dịch viên sẽ in một lời giới thiệu về phiên bản Python của bạn; chỉ đơn giản là kiểm tra xem bạn đang chạy Python 3.2 hoặc mới hơn (ở đây là cho 3.4.2):
Python 3.4.2 (mặc định, 15 Tháng mười 2014, 22:01:37)
[GCC 4.2.1 tương thích của Apple LLVM 5.1 (vang-503,0 .40)] trên darwin
Loại "giúp đỡ", "bản quyền", "tín dụng" hoặc "giấy phép" để biết thêm thông tin.
>>>
Lưu ý
Nếu bạn không thể chạy thông dịch Python, có thể bạn không có Python được cài đặt một cách chính xác. Vui lòng truy cập http://python.org/ để được hướng dẫn chi tiết. NLTK 3,0 công trình Python 2.6 và 2.7. Nếu bạn đang sử dụng một trong các phiên bản cũ, lưu ý / nhà điều hành viên đạn kết quả phân đoạn xuống (do đó 1/3 sẽ cho bạn 0). Để có được những hành vi dự kiến của bộ phận bạn cần phải gõ: từ __future__ bộ phận nhập khẩu
Các >>> nhanh chóng chỉ ra rằng các thông dịch Python hiện đang chờ đợi đầu vào. Khi sao chép các ví dụ từ cuốn sách này, không gõ ">>>" chính mình. Bây giờ, chúng ta hãy bắt đầu bằng cách sử dụng Python như một máy tính:
>>> 1 + 5 * 2 - 3
8
>>>
Khi người phiên dịch đã hoàn thành tính toán câu trả lời và hiển thị nó, lại xuất hiện dấu nhắc. Điều này có nghĩa các thông dịch Python đang chờ đợi để được hướng dẫn khác.
Lưu ý
Turn của bạn: Nhập một vài thành ngữ của riêng bạn. Bạn có thể sử dụng dấu hoa thị (*) cho phép nhân và slash (/) để phân chia, và dấu ngoặc đơn cho bracketing biểu thức.
Các ví dụ trên đây chứng minh làm thế nào bạn có thể làm việc tương tác với các thông dịch Python, thử nghiệm với các biểu thức khác nhau trong các ngôn ngữ để xem những gì họ làm. Bây giờ chúng ta hãy thử một biểu hiện vô nghĩa để xem cách thông dịch xử lý nó:
>>> 1 +
File "", Dòng 1
1 +
^
Cú pháp: cú pháp hợp lệ
>>>
Điều này tạo ra một lỗi cú pháp Trong Python, nó không có ý nghĩa để kết thúc một lệnh với một dấu cộng Các dịch Python chỉ ra đường, nơi các vấn đề xảy ra (dòng.. 1 của, Viết tắt của "đầu vào tiêu chuẩn").
Bây giờ chúng ta có thể sử dụng các thông dịch Python, chúng tôi đã sẵn sàng để bắt đầu làm việc với dữ liệu ngôn ngữ.
1.2 begin with NLTK
cài đặt NLTK 3.0,
cài đặt các dữ liệu cần thiết cho cuốn sách bằng cách nhập lệnh sau hai lệnh tại dấu nhắc của Python, sau đó chọn các bộ sưu tập sách như trong 1.1.
>>> import NLTK
>>> nltk.download () bước đầu tiên là kiểu command line đặt biệt of Python used to tải văn bản: từ nltk.book . nhập khẩu * danh từ: >>> từ nhập khẩu nltk.book * *** Ví dụ giới thiệu cho sách NLTK *** Đang tải text1, ..., text9 và sent1, ..., sent9 Gõ tên của văn bản hoặc . câu để xem nó Type: 'văn bản ()' hoặc 'sents ()' để liệt kê các vật liệu. text1: Moby Dick của Herman Melville 1851 Text2: Sense and Sensibility của Jane Austen 1811 Text3: The Book of Genesis text4: nhậm chức Corpus text5: Chat Corpus text6: Monty Python và Holy Grail text7: Wall Street Journal text8: Quen Corpus text9: The Man Who Was thứ năm của G. K. Chesterton 1908 >>> Tìm text1, Text2 thì gõ: >>> text1
>>> Text2
>>>
1.3 Tìm văn bản:
Có many cách to verify bối cảnh of an văn bản ngoài việc chỉ đơn giản is read it. Một quan điểm Concordance for our thấy every sự xuất hiện of a word nào that, cùng with one số context. Ở đây us nhìn lên wordmonstrous in Moby Dick bằng cách nhập text1 following is one time period, then đặt "quái dị" trong Bracket
>>> text1.concordance ( "quái dị")
Hiển thị 11 trong tổng số 11 trận đấu:
ong cũ , một là của một kích thước khổng lồ nhất. ... Này đi về phía chúng tôi,
ON của các Thánh Vịnh. "Chạm rằng số lượng lớn khổng lồ của cá voi hoặc ork chúng tôi có r
ll so với một mảng heathenish của các câu lạc bộ khổng lồ và giáo mác Một số đã được dày.
D như bạn nhìn, và tự hỏi những gì người ăn thịt người khổng lồ và hung dữ bao giờ có thể hav
đã sống sót lũ; nhất khổng lồ và miền núi nhất! Đó Himmal
họ có thể trinh sát tại Moby Dick là một truyền thuyết quái dị, hay vẫn còn tồi tệ hơn và de nhiều
thứ của Radney '. "CHƯƠNG 55 trong Hình khổng lồ của cá voi. Tôi sẽ ere l
ing Cảnh. Trong liên quan với những hình ảnh quái dị của cá voi, tôi mạnh
ere để nhập vào những câu chuyện vẫn còn quái dị hơn của họ mà là để được fo
ght đã bị lục lọi ra khỏi tủ khổng lồ này không có nói. Nhưng
của Whale - Xương; cho cá voi có kích thước khổng lồ được đôi khi cast lên chết u
>>>
Một Concordance allowed to our nhìn thấy từ trong ngữ cản
đang được dịch, vui lòng đợi..