본문 바로가기

llm

[딥러닝] view, reshape 차이? 모델링 차원 크기 변경 방법 딥러닝 모델을 만들때 데이터 처리기술은 정말로 중요하다. 처음 모델링을 한다면 위의 4가지 특징에 대하여 혼란이 있을 수 있다. 따라서 한번 정리해보려 한다. 딥러닝에서 view, squeeze, unsqueeze, reshape 는 텐서의 모양을 조작하고 변형하는데 중요한 연산작용을 한다. 이에 대한 각각의 기능과 예제를 통해 알아보자. 1. view (차원 변경) - view는 텐서의 원소의 개수를유지하면서 차원을 조정한다. 아래의 예시를 보면 원본 텐서 생성이 12이고 12의 약수가 3 *4 이다. 따라서 이 원소의 개수를 유지하면서 차원을 변경한 형태이다. import torch # 원본 텐서 생성 x = torch.arange(12) # 텐서의 모양을 (3, 4)로 변경 y = x.view(3,.. 더보기
[머신러닝] LSTM - GRU 란? LSTM(장단기 메모리 네트워크)와 GRU(게이트 순환 유닛)는 시계열 데이터와 자연어 처리 등에서 주로 사용되는 순환 신경망(RNN)의 변형된 형태입니다. LSTM(Long Short-Term Memory) - LSTM은 RNN의 한 종류로, 장기 의존성 문제를 해결하기 위해 고안되었습니다. - 이를 위해 '게이트(gate)'라 불리는 구조를 사용하여 정보의 흐름을 조절합니다. 게이트 구조는 다음 편에서 어떤 건지 알아봅시다. - 입력 게이트, 삭제 게이트, 출력 게이트 등으로 구성되어 각 게이트는 정보를 선택적으로 기억하거나 잊을 수 있도록 합니다. - 기본 RNN과 달리, LSTM은 장기적인 의존성을 학습하고 기억하는 능력이 있어 긴 시퀀스에서 효과적으로 작동합니다. GRU(Gated Recurre.. 더보기
엔비디아 2023 인공지능 컨퍼런스 취소 NVIDIA의 이스라엘 인공지능 정상회의 취소로 안전 우려로 인해 2023년 10월 15일과 16일에 예정된 실제 인공지능 정상회의가 지역 내 불안정한 안전 상황으로 인해 취소되었습니다. 컨퍼런스 취소 사유 NVIDIA는 이스라엘 텔아비브에서 예정된 인공지능 정상회의를 안전 우려로 인해 취소했습니다. 이 지역의 안전 상황이 불안정해진 것이 이 취소의 이유입니다. 참석 예정 인원 및 주요 연설 이 정상회의는 약 2,500명의 연구자와 개발자들이 참석할 예정이었으며, NVIDIA의 CEO Jensen Huang의 주요 연설이 예정되어 있었습니다. 회의 주요 내용 정상회의는 자율 주행 차량, 생성적인 인공지능, 로봇공학, 의료, 오믈니버스, 사이버보안 및 대형 언어 모델을 포함한 다양한 주제에 관한 세션과 워.. 더보기