Scikit-learn là gì

 - 

Scikit-learning , được phát triển lần thứ nhất dưới dạng dự án Google Summer of Code vào thời điểm năm 2007, hiện nay được coi là thư viện Pyhạn hẹp phổ biến tuyệt nhất mang lại trang bị học.

Bạn đang xem: Scikit-learn là gì

Có một trong những lý do vì sao thư viện này được coi là một Một trong những gạn lọc tốt nhất có thể cho các dự án học sản phẩm công nghệ, đặc biệt là trong số khối hệ thống thêm vào. Chúng bao gồm, nhưng không giới hạn nghỉ ngơi gần như điều tiếp sau đây.

Nó có mức độ hỗ trợ cao và làm chủ ngặt nghèo cho việc cải tiến và phát triển của tlỗi viện, Có nghĩa là nó là 1 trong những công cụ cực kì mạnh mẽ. Có một phong cách mã ví dụ, đồng hóa đảm bảo rằng mã trang bị học tập của chúng ta dễ hiểu và dễ tái sản xuất, mặt khác cũng làm sút đáng kể ngăn cản gia nhập những quy mô thiết bị học mã hóa. Nó được hỗ trợ thoáng rộng vì chưng các chế độ của bên máy ba phải hoàn toàn có thể làm cho đa dạng thêm chức năng đến phù hợp với khá nhiều ngôi trường hợp thực hiện.

Bài viết sau đấy là phần ra mắt gần gũi với người mới ban đầu về điều khoản cùng sẽ hỗ trợ cho bạn đầy đủ đọc biết để hoàn toàn có thể phát triển một quy mô học thiết bị dễ dàng và đơn giản.

Để setup phiên phiên bản tiên tiến nhất của Scikit-learning, hãy chạy như sau.

pip install scikit-learn

Công nạm dự tính

Thư viện Scitkit-learning cung cấp rất nhiều thuật tân oán được tạo ra sẵn nhằm thực hiện cả học tập lắp thêm bao gồm tính toán cùng không thống kê giám sát. Chúng thường xuyên được Điện thoại tư vấn là công nỗ lực ước tính .

Công gắng ước tính chúng ta chọn cho dự án của chính bản thân mình vẫn phụ thuộc vào vào tập dữ liệu chúng ta bao gồm và sự việc ai đang cố gắng giải quyết. Tài liệu Scikit-learning cung ứng một giải pháp hữu dụng sơ vật này, được hiển thị bên dưới, để giúp chúng ta xác minh thuật toán thù như thế nào cân xứng cùng với nhiệm vụ của công ty.


*

Điều khiến cho Scikit-learning trở đề nghị dễ thực hiện là bất cứ quy mô hoặc thuật toán thù bạn đang sử dụng là gì, kết cấu mã cho huấn luyện và giảng dạy và dự đoán quy mô số đông tương tự nhau.

Để minc họa vấn đề này, hãy chạy sang một ví dụ.

Giả sử ai đang giải một bài xích toán thù hồi quy cùng mong muốn đào tạo một thuật toán thù hồi quy tuyến đường tính và thực hiện quy mô công dụng để mang ra dự đoán thù. Cách trước tiên, cùng với Scikit-learning, là Call cách thức ước chừng hồi quy logistic với lưu giữ nó bên dưới dạng một đối tượng. ví dụ như tiếp sau đây Hotline thuật toán thù với lưu lại nó bên dưới dạng một đối tượng người dùng có tên lr .

Cách tiếp sau là tạo nên quy mô cân xứng cùng với một vài dữ liệu đào tạo và huấn luyện. Như vậy được thực hiện bằng cách thực hiện cách làm fit () . Chúng tôi gọi lr.fit()những nhân tài và tài liệu đích với lưu giữ quy mô hiệu quả dưới dạng một đối tượng người tiêu dùng được Call là tế bào hình . Trong ví dụ tiếp sau đây, tôi cũng đang sử dụng train_test_split()cách thức nhằm phân chia tập dữ liệu thành dữ liệu thí nghiệm và đào tạo và giảng dạy.

Tiếp theo, chúng tôi thực hiện quy mô cùng cách làm dự đoán () để tham gia đoán bên trên dữ liệu trước đó chưa từng thấy trước đó.

Nếu bây giờ họ áp dụng Scitkit-learning nhằm triển khai một trách nhiệm khác, chẳng hạn, họ muốn giảng dạy một cỗ phân loại rừng thốt nhiên. Mã sẽ trông rất giống như nhau và có cùng số bước.

Cấu trúc mã đồng bộ này làm cho việc trở nên tân tiến những mô hình học trang bị trngơi nghỉ nên cực kì dễ dàng nắm bắt và cũng tạo nên mã rất có thể đọc với tái sinh sản cao.

Sơ chế

Trong phần lớn những dự án trang bị học trong trái đất thực, tài liệu cơ mà các bạn sử dụng sẽ không còn tuyệt nhất thiết đề xuất sẵn sàng để đào tạo và giảng dạy một quy mô. Rất có tác dụng trước tiên các bạn sẽ nên triển khai một trong những bước đổi khác với tiền cách xử trí tài liệu nhỏng cách xử lý các quý giá bị thiếu, biến hóa dữ liệu phân các loại thành số hoặc vận dụng tính năng không ngừng mở rộng quy mô.

Xem thêm: Cuối Cùng Tiếng Anh Là Gì ? 3000 Từ Tiếng Anh Thông Dụng

Scikit-learning có các cách thức tích phù hợp nhằm tiến hành công việc chi phí xử trí này. Ví dụ: SimpleImputer () điền vào những quý hiếm bị thiếu thốn bởi một cách làm chúng ta chọn.

Tài liệu Scikit-learning liệt kê những tùy chọn không thiếu nhằm giải pháp xử lý trước tài liệu tại phía trên .

Đánh giá bán

lúc một quy mô đã làm được huấn luyện và đào tạo, bạn cần giám sát cường độ tốt của quy mô trong Việc dự đân oán bên trên dữ liệu new. Bước này được hotline là Đánh Giá mô hình với số liệu các bạn lựa chọn sẽ tiến hành xác minh vì trọng trách ai đang nỗ lực giải quyết và xử lý. lấy một ví dụ, thường thì trong một bài tân oán hồi quy, chúng ta cũng có thể lựa chọn RMSE trong những khi để phân loại, bạn có thể chọn điểm F1.

Tất cả những lý lẽ dự tính rất nhiều gồm 1 cách làm score () trả về một chỉ số khoác định có liên quan tuyệt nhất cho nhiệm vụ học tập thứ nhưng bọn chúng tiến hành.

Bên cạnh đó, Scikit-learning tất cả một tập hòa hợp các hàm số liệu để cung ứng đánh giá chi tiết rộng cho một mô hình. Ví dụ: so với những trọng trách phân một số loại, tlỗi viện gồm một báo cáo phân một số loại cung cấp độ đúng đắn, tịch thu, điểm F1 cùng độ đúng chuẩn tổng thể.

Mã cùng công dụng report phân một số loại được hiển thị dưới.


*

Tối ưu hóa quy mô

Tất cả các chế độ khoảng chừng trong thỏng viện Scikit-learning mọi chứa một loạt những ttê mê số, có khá nhiều tùy chọn. Các quý hiếm cơ mà bạn lựa chọn cho 1 thuật tân oán ví dụ đang tác động cho công dụng hoạt động của quy mô ở đầu cuối. Ví dụ: với RandomForestClassifier, bạn có thể đặt max_depth của cây thành bất kỳ quý hiếm như thế nào cùng tùy trực thuộc vào dữ liệu cùng tác vụ của công ty, các cực hiếm khác nhau mang đến tyêu thích số này sẽ khởi tạo ra các kết quả khác nhau.

Quá trình thử phối kết hợp những tsi số khác biệt để tìm ra sự phối kết hợp buổi tối ưu được điện thoại tư vấn là về tối ưu hóa hết sức tyêu thích số .

Scikit-learning cung cấp nhì mức sử dụng để tự động hóa tiến hành tác vụ này, GridSearchCV thực hiện một nghệ thuật được gọi là tìm kiếm kiếm lưới toàn vẹn với RandomizedSearchCV triển khai về tối ưu hóa ttê mê số tình cờ .

Ví dụ dưới đây thực hiện GridSearchCV để tra cứu các tđê mê số buổi tối ưu mang đến RandomForestClassifier. Đầu ra được hiển thị dưới mã.


*

Đường ống

Gói Scikit-learning cung cấp một dạng gói gọn mã thuận tiện hơn làm việc dạng mặt đường ống . Công thế này được cho phép toàn bộ các trách nhiệm chi phí cách xử lý được xâu chuỗi cùng rất bước phân một số loại nhằm chỉ việc gọi fit () hoặc dự đân oán () bên trên một đối tượng người sử dụng đường ống tuyệt nhất triển khai toàn bộ các bước trong quy trình làm việc của khách hàng.

Vấn đề này tạo cho mã dễ đọc với giảm sự tái diễn công việc vào tiến trình học tập sản phẩm của người sử dụng.

Để chế tạo ra một đường ống, trước tiên bọn họ xác minh các bước trong đối tượng mà tôi đã Gọi là con đường ống trong đoạn mã bên dưới. Sau kia, chúng ta cũng có thể chỉ cần hotline fit trên đối tượng người sử dụng này để giảng dạy quy mô. Đối tượng đường ống cũng hoàn toàn có thể được sử dụng để mang ra dự đoán về tài liệu bắt đầu.

Xem thêm: 10 Thực Phẩm Tốt Cho Mắt

Nếu mình thích bài viết này với mong tò mò thêm tlỗi viện Scikit-learning, bạn cũng có thể muốn gọi những nội dung bài viết trước đó của tôi được hiển thị dưới.

Hướng dẫn dễ dàng và đơn giản về mặt đường ống Scikit-learning

Cảm ơn bởi vì sẽ đọc!

Tôi gửi phiên bản tin hàng tháng nếu bạn có nhu cầu tđắm say gia, vui vẻ ĐK qua link này. Mong được biến hóa một phần vào hành trình học tập của bạn!


Chuyên mục: Tài liệu