메뉴 건너뛰기



Amazon SageMaker BlazingText: 다중 CPU/GPU상에서 Word2Vec 알고리즘의 병렬 처리 이 글에서는 Amazon SageMaker에서 제공하는 알고리즘 중 2018년 1월에 출시된 BlazingText를 소개하고자 합니다. BlazingText는 Word2Vec임베딩을 생성하기 위한 비지도 학습 알고리즘입니다. 여기서 말하는 임베딩이란 대규모 코퍼스(말뭉치)에 있는 단어들이 밀집되어 있는 벡터를 의미합니다. 다음과 같은 환경에서 Amazon SageMaker를 사용하실 경우, BlazingText를 이용해서 Word2Vec을 빠르게 구현할 수 있습니다: (Mikolov의 Word2Vec C버전, fastText 같은 알고리즘을 위한) 단일 CPU 인스턴스 P2, P3 처럼 다중 GPU로 구성된 단일 인스턴스 (분산 CPU 트레이닝을 위한) 다중 CPU 인스턴스 p3.2xlarge (1 Volta V100 GPU) 인스턴스 1대 상에서BlazingText와 c4.2xlarge 인스턴스 1대 상에서 fastText 와 비교하면 BlazingText가 약 21배 빠르고 비용면에서도 20% 가량 저렴합니다. 여러개의 CPU 노드로 구성된 분산 트레이닝의 경우 BlazingText는 c4.8xlarge 인스턴스 8대에서 최대 초당 5천만 단어까지 학습 속도를 낼 수 있는데, 이는 c4.8xlarge  인스턴스 1대에서 fastText의 CPU 버전과 비교하면 임베딩의 퀄리티에 영향을 거의 주지 않으면서도 속도면에서 약 11배나 빠른 [ more... ]

The post Amazon SageMaker BlazingText: 다중 CPU/GPU상에서 Word2Vec 알고리즘의 병렬 처리 appeared first on 지락문화예술공작단.

원문출처 : https://jirak.net/wp/amazon-sagemaker-blazingtext-%EB%8B%A4%EC%A4%91-cpu-gpu%EC%83%81%EC%97%90%EC%84%9C-word2vec-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98%EC%9D%98-%EB%B3%91%EB%A0%AC-%EC%B2%98%EB%A6%AC/
번호 제목 글쓴이 날짜 조회 수
400 9 plugins you should definitely have heard of to prevent data leaks, security breaches and to get more flexibility in the way you log in to your Piwik. 관리자 2017.01.10 294
399 Desktop Bridge: Creators Update 관리자 2017.04.01 294
398 Using Packer and Terraform for High Availability of NGINX Plus on Google Cloud Engine 관리자 2017.08.18 294
397 Windows Community Standup on September 14th, 2017 관리자 2017.09.08 294
396 AWS 주간 소식 모음 – 2017년 12월 4일 관리자 2017.12.04 294
395 Bringing expressive, performant typography to Microsoft Edge with Variable Fonts 관리자 2018.03.14 294
394 Connecting Your Apps with Docker and NGINX, Part II: Immutable Infrastructure 관리자 2016.05.14 295
393 Windows 10 Tip: Use Cortana above your lock screen 관리자 2016.08.23 295
392 This Week on Windows: Cortana tips, Windows 10 PC offers and more 관리자 2016.08.27 295
391 Microsoft HoloLens featured in Popular Mechanics Breakthrough Awards 관리자 2016.09.08 295
390 Hendrick Motorsports gains competitive advantage on the race track 관리자 2016.09.27 295
389 Extend your reach with offline licensing in Windows Store for Business 관리자 2016.09.30 295
388 New features arrive in Microsoft Photos on Windows 10 관리자 2016.12.14 295
387 CES 2017: Acer announces new PCs for gaming, immersive 4K entertainment and virtual reality 관리자 2017.01.04 295
386 Forza Horizon 3 Playseat Car Pack hits the open road tomorrow 관리자 2017.02.07 295