메뉴 건너뛰기

GREATUSER

free

Amazon SageMaker BlazingText: 다중 CPU/GPU상에서 Word2Vec 알고리즘의 병렬 처리 이 글에서는 Amazon SageMaker에서 제공하는 알고리즘 중 2018년 1월에 출시된 BlazingText를 소개하고자 합니다. BlazingText는 Word2Vec임베딩을 생성하기 위한 비지도 학습 알고리즘입니다. 여기서 말하는 임베딩이란 대규모 코퍼스(말뭉치)에 있는 단어들이 밀집되어 있는 벡터를 의미합니다. 다음과 같은 환경에서 Amazon SageMaker를 사용하실 경우, BlazingText를 이용해서 Word2Vec을 빠르게 구현할 수 있습니다: (Mikolov의 Word2Vec C버전, fastText 같은 알고리즘을 위한) 단일 CPU 인스턴스 P2, P3 처럼 다중 GPU로 구성된 단일 인스턴스 (분산 CPU 트레이닝을 위한) 다중 CPU 인스턴스 p3.2xlarge (1 Volta V100 GPU) 인스턴스 1대 상에서BlazingText와 c4.2xlarge 인스턴스 1대 상에서 fastText 와 비교하면 BlazingText가 약 21배 빠르고 비용면에서도 20% 가량 저렴합니다. 여러개의 CPU 노드로 구성된 분산 트레이닝의 경우 BlazingText는 c4.8xlarge 인스턴스 8대에서 최대 초당 5천만 단어까지 학습 속도를 낼 수 있는데, 이는 c4.8xlarge  인스턴스 1대에서 fastText의 CPU 버전과 비교하면 임베딩의 퀄리티에 영향을 거의 주지 않으면서도 속도면에서 약 11배나 빠른 [ more... ]

The post Amazon SageMaker BlazingText: 다중 CPU/GPU상에서 Word2Vec 알고리즘의 병렬 처리 appeared first on 지락문화예술공작단.




원문출처 : https://jirak.net/wp/amazon-sagemaker-blazingtext-%EB%8B%A4%EC%A4%91-cpu-gpu%EC%83%81%EC%97%90%EC%84%9C-word2vec-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98%EC%9D%98-%EB%B3%91%EB%A0%AC-%EC%B2%98%EB%A6%AC/
번호 제목 글쓴이 날짜 조회 수
160 Announcing Windows 10 Insider Preview Build 17115 for Fast 관리자 2018.03.07 96
159 Announcing Windows 10 Insider Preview Build 17120 for Fast 관리자 2018.03.14 96
158 Announcing Project Honolulu Technical Preview 1803 and RSAT Insider Preview for Windows 10 관리자 2018.03.14 96
157 Announcing Windows 10 Insider Preview Build 17127 for Fast 관리자 2018.03.21 96
156 Windows 10 Tip: Five expert tips to help you master ink in OneNote 관리자 2018.04.03 96
155 All the new laptops, All-in-Ones, and game-ready PCs Dell announced this week 관리자 2018.04.05 96
154 Windows Hello and FIDO2 Security Keys enable secure and easy authentication for shared devices 관리자 2018.04.18 96
153 Windows Community Standup – Improvements for Web and Backend Developers in the next update to Windows 10 관리자 2018.04.19 96
152 Announcing Windows 10 Insider Preview Build 17650 for Skip Ahead 관리자 2018.04.20 96
151 Announcing new Microsoft Store Summer Camps to provide students with real-world digital skills 관리자 2018.04.24 96
150 How should I write my privacy notice for Matomo Analytics under GDPR? 관리자 2018.04.24 96
149 WordPress Analytics plugin WP-Piwik reaches version 1.0.0 (and 50,000 active users) 관리자 2016.01.06 97
148 Analytics for the Internet of Things: collecting all your things’ data with Piwik to stay in control? 관리자 2016.01.06 97
147 Maximizing PHP 7 Performance with NGINX, Part I: Web Serving and Caching 관리자 2016.02.27 97
146 Connecting Your Apps with Docker and NGINX, Part II: Immutable Infrastructure 관리자 2016.05.14 97
위로