메뉴 건너뛰기

GREATUSER

free

Amazon SageMaker BlazingText: 다중 CPU/GPU상에서 Word2Vec 알고리즘의 병렬 처리 이 글에서는 Amazon SageMaker에서 제공하는 알고리즘 중 2018년 1월에 출시된 BlazingText를 소개하고자 합니다. BlazingText는 Word2Vec임베딩을 생성하기 위한 비지도 학습 알고리즘입니다. 여기서 말하는 임베딩이란 대규모 코퍼스(말뭉치)에 있는 단어들이 밀집되어 있는 벡터를 의미합니다. 다음과 같은 환경에서 Amazon SageMaker를 사용하실 경우, BlazingText를 이용해서 Word2Vec을 빠르게 구현할 수 있습니다: (Mikolov의 Word2Vec C버전, fastText 같은 알고리즘을 위한) 단일 CPU 인스턴스 P2, P3 처럼 다중 GPU로 구성된 단일 인스턴스 (분산 CPU 트레이닝을 위한) 다중 CPU 인스턴스 p3.2xlarge (1 Volta V100 GPU) 인스턴스 1대 상에서BlazingText와 c4.2xlarge 인스턴스 1대 상에서 fastText 와 비교하면 BlazingText가 약 21배 빠르고 비용면에서도 20% 가량 저렴합니다. 여러개의 CPU 노드로 구성된 분산 트레이닝의 경우 BlazingText는 c4.8xlarge 인스턴스 8대에서 최대 초당 5천만 단어까지 학습 속도를 낼 수 있는데, 이는 c4.8xlarge  인스턴스 1대에서 fastText의 CPU 버전과 비교하면 임베딩의 퀄리티에 영향을 거의 주지 않으면서도 속도면에서 약 11배나 빠른 [ more... ]

The post Amazon SageMaker BlazingText: 다중 CPU/GPU상에서 Word2Vec 알고리즘의 병렬 처리 appeared first on 지락문화예술공작단.




원문출처 : https://jirak.net/wp/amazon-sagemaker-blazingtext-%EB%8B%A4%EC%A4%91-cpu-gpu%EC%83%81%EC%97%90%EC%84%9C-word2vec-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98%EC%9D%98-%EB%B3%91%EB%A0%AC-%EC%B2%98%EB%A6%AC/
번호 제목 글쓴이 날짜 조회 수
1165 Announcing UWP Community Toolkit 1.1 관리자 2016.10.06 569
1164 이것이 리눅스다 – 우재남저 (한빛미디어) 관리자 2015.12.31 569
1163 What’s new in the Windows 10 April 2018 Update 관리자 2018.05.01 568
1162 COM Server and OLE Document support for the Desktop Bridge 관리자 2017.04.14 568
1161 Make the most of your time with the new Windows 10 update 관리자 2018.04.28 567
1160 How should I write my privacy notice for Matomo Analytics under GDPR? 관리자 2018.04.24 567
1159 AWS API 호출 하기 (2) – Amazon S3 객체에 대한 미리 선언된(pre-signed) URL 생성하기 관리자 2016.02.04 567
1158 Play your favorite music, movies, and more with iTunes: now available in Microsoft Store 관리자 2018.04.27 566
1157 MySQL 8.0 – Announcing GA of the MySQL Document Store 관리자 2018.04.20 566
1156 Amazon EC2 Container Registry(ECR), 서울 리전 출시 관리자 2017.10.11 566
1155 Windows 10 Tip: How to get started viewing and streaming with Mixer 관리자 2017.07.11 566
1154 How to not process any personal data with Matomo and what it means for you 관리자 2018.04.23 565
1153 This Week on Windows: Windows 10 Creators Update, Xbox Clubs and more 관리자 2017.03.31 565
1152 NGINX Named by Gartner as a Top Application Delivery Controller for Modern Day Application Delivery 관리자 2016.09.07 565
1151 Announcing Windows Server 2019 Insider Preview Build 17639 관리자 2018.04.11 564
위로