메뉴 건너뛰기



Amazon SageMaker BlazingText: 다중 CPU/GPU상에서 Word2Vec 알고리즘의 병렬 처리 이 글에서는 Amazon SageMaker에서 제공하는 알고리즘 중 2018년 1월에 출시된 BlazingText를 소개하고자 합니다. BlazingText는 Word2Vec임베딩을 생성하기 위한 비지도 학습 알고리즘입니다. 여기서 말하는 임베딩이란 대규모 코퍼스(말뭉치)에 있는 단어들이 밀집되어 있는 벡터를 의미합니다. 다음과 같은 환경에서 Amazon SageMaker를 사용하실 경우, BlazingText를 이용해서 Word2Vec을 빠르게 구현할 수 있습니다: (Mikolov의 Word2Vec C버전, fastText 같은 알고리즘을 위한) 단일 CPU 인스턴스 P2, P3 처럼 다중 GPU로 구성된 단일 인스턴스 (분산 CPU 트레이닝을 위한) 다중 CPU 인스턴스 p3.2xlarge (1 Volta V100 GPU) 인스턴스 1대 상에서BlazingText와 c4.2xlarge 인스턴스 1대 상에서 fastText 와 비교하면 BlazingText가 약 21배 빠르고 비용면에서도 20% 가량 저렴합니다. 여러개의 CPU 노드로 구성된 분산 트레이닝의 경우 BlazingText는 c4.8xlarge 인스턴스 8대에서 최대 초당 5천만 단어까지 학습 속도를 낼 수 있는데, 이는 c4.8xlarge  인스턴스 1대에서 fastText의 CPU 버전과 비교하면 임베딩의 퀄리티에 영향을 거의 주지 않으면서도 속도면에서 약 11배나 빠른 [ more... ]

The post Amazon SageMaker BlazingText: 다중 CPU/GPU상에서 Word2Vec 알고리즘의 병렬 처리 appeared first on 지락문화예술공작단.

원문출처 : https://jirak.net/wp/amazon-sagemaker-blazingtext-%EB%8B%A4%EC%A4%91-cpu-gpu%EC%83%81%EC%97%90%EC%84%9C-word2vec-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98%EC%9D%98-%EB%B3%91%EB%A0%AC-%EC%B2%98%EB%A6%AC/
번호 제목 글쓴이 날짜 조회 수
1165 E3 2017: Alienware and Dell announce PC gaming systems powered by Windows 10 관리자 2017.06.13 103
1164 Amazon Athena – 초단위 페타바이트급 동적 데이터 질의 서비스 관리자 2016.12.01 103
1163 Amazon ElastiCache 업데이트 – Redis 스냅샷 S3에 저장하기 관리자 2016.06.03 103
1162 WordPress Analytics plugin WP-Piwik reaches version 1.0.0 (and 50,000 active users) 관리자 2016.01.06 103
1161 Windows Hello and FIDO2 Security Keys enable secure and easy authentication for shared devices 관리자 2018.04.18 102
1160 All the new laptops, All-in-Ones, and game-ready PCs Dell announced this week 관리자 2018.04.05 102
1159 Announcing gRPC Support in NGINX 관리자 2018.03.18 102
1158 AWS 도움말 문서, GitHub에서 오픈 소스로 공개 관리자 2018.03.16 102
1157 Windows Insiders get first look at new privacy screen settings layout coming to Windows 10 관리자 2018.03.07 102
1156 Amazon S3 Select 및 Glacier Select – 원하는 객체 기반 데이터 질의 기능 출시 관리자 2017.12.11 102
1155 This Week on Windows: E3, the new Surface Pro, Surface Laptop, Windows 10 S and more 관리자 2017.06.16 102
1154 EC2 Systems Manager – EC2 및 온-프레미스 서버 함께 관리하기 관리자 2017.01.12 102
1153 Maximizing PHP 7 Performance with NGINX, Part I: Web Serving and Caching 관리자 2016.02.27 102
1152 We are hiring engineers to build an awesome product and platform used by millions of people 관리자 2016.02.17 102
1151 Announcing Windows 10 Insider Preview Build 17115 for Fast 관리자 2018.03.07 101