Bias-Aware Heapified Policy for Active Learning

Đăng nhập

Đăng ký

Việc làm
Tìm việc
Theo dõi bản tin tuyển dụng được cập nhật liên tục theo nhóm ngành và vị trí.
Tìm công ty
Tìm kiếm việc làm theo tên công ty.
Tin tuyển dụng theo ngành
Khám phá việc làm mới nhất được tổng hợp theo nhóm ngành, nghề.
Tải app CakeResume
Công cụ
CV
Tạo CV online chuyên nghiệp, miễn phí
Portfolio
Trình bày kỹ năng chuyên môn và dự án đã thực hiện một cách sinh động, trực quan.
CV
Tạo CV online chuyên nghiệp, miễn phí
Tạo CV
Tạo CV online chuyên nghiệp, miễn phí
Mẫu CV
Truy cập kho mẫu CV online ấn tượng, chuẩn quốc tế.
CV mẫu
Tham khảo các CV mẫu đẹp đã được người dùng CakeResume ứng tuyển thành công.
Cẩm nang nghề nghiệp
Tìm hiểu cách viết CV cho từng ngành nghề và vị trí.
Trợ giúp viết CV
Tham khảo lời khuyên từ các chuyên gia tuyển dụng của CakeResume.
Portfolio
Trình bày kỹ năng chuyên môn và dự án đã thực hiện một cách sinh động, trực quan.
Tạo portfolio
Thiết kế portfolio cá nhân xịn sò để thể hiện bản thân một cách ấn tượng nhất.
Bộ sưu tập portfolio
Tham khảo các portfolio đẹp mắt từ người dùng của CakeResume.
Kho tài nguyên
Blog
Đón đọc những bài viết hữu ích chia sẻ về cẩm nang tìm việc, định hướng nghề nghiệp, tin tức ngành,...
Xem bài viết
Cẩm nang ứng viên
CV & Hồ sơ xin việc
Cover Letter
Portfolio
Phỏng vấn
Bí quyết tìm việc
Thế giới công sở
Định hướng nghề nghiệp
Chuyện đi làm
Kỹ năng nghề nghiệp
Tin tức
Về đối tác
Về đối tác
Cẩm nang doanh nghiệp
Quản lý nhân sự
Giải pháp tuyển dụng
Về CakeResume
Văn hoá & Con người
Sản phẩm/DỊch vụ
Sự kiện
Bài viết nổi bật
Chuyện đi làm
Cách trả lời thư mời nhận việc chuyên nghiệp (kèm email mẫu)
Đọc thêm
Tuyển dụng
Tìm kiếm nhân tài
Tìm CV
Đăng tin tuyển dụng
Bắt đầu miễn phí
Dịch vụ tuyển dụng
Thu hút nhân tài
Employer of Record (EOR)
Hỗ trợ doanh nghiệp tại Đài Loan
Thương hiệu nhà tuyển dụng
Xây dựng và quảng bá thương hiệu nhà tuyển dụng
Bảng giá
Gói đăng tin tuyển dụng
Gói tìm kiếm nhân tài
Gói tạo CV
Networking
Danh sách bạn bè
Truy cập danh sách bạn bè và quản lý tài khoản của bạn.
CakeResume Meet
Mở rộng mạng lưới mối quan hệ nghề nghiệp.
Cộng đồng
Tương tác với các người dùng khác thông qua forum trò chuyện và sự kiện networking.
Tải app CakeResume

Networking

Danh sách bạn bè

Truy cập danh sách bạn bè và quản lý tài khoản của bạn.

CakeResume Meet

Mở rộng mạng lưới mối quan hệ nghề nghiệp.

Cộng đồng

Tương tác với các người dùng khác thông qua forum trò chuyện và sự kiện networking.

Bias-Aware Heapified Policy for Activ...

ByWen-Yen Chang

Data Scientist / Machine Learning Engineer

・

Taiwan Province, Taiwan

[Publication] Bias-Aware Heapified Policy for Active Learning, in CVGIP, 2019. Abstract: The data efficiency of learning-based algorithms is more and more important since high-quality and clean data is expensive as well as hard to collect. In order to achieve high model performance with the least number of samples, active learning is a technique that queries the most important subset of data from the original dataset. In active learning domain, one of the mainstream research is the heuristic uncertainty-based method which is useful for the learning-based system. Recently, a few works propose to apply policy reinforcement learning (PRL) for querying important data. It seems more general than heuristic uncertainty-based method owing that PRL method depends on data feature which is reliable than human prior. However, there have two problems-sample inefficiency of policy learning and overconfidence, when applying PRL on active learning. To be more precise, sample inefficiency of policy learning occurs when sampling within a large action space, in the meanwhile, class imbalance can lead to the overconfidence. In this paper, we propose a bias-aware policy network called Heapified Active Learning (HAL), which prevents overconfidence, and improves sample efficiency of policy learning by heapified structure without ignoring global inforamtion (overview of the whole unlabeled set). In our experiment, HAL outperforms other baseline methods on MNIST dataset and duplicated MNIST. Last but not least, we investigate the generalization of the HAL policy learned on MNIST dataset by directly applying it on MNIST-M. We show that the agent can generalize and outperform directly-learned policy under constrained labeled sets.