본문 바로가기

728x90

llm6

[딥러닝] view, reshape 차이? 모델링 차원 크기 변경 방법 딥러닝 모델을 만들때 데이터 처리기술은 정말로 중요하다. 처음 모델링을 한다면 위의 4가지 특징에 대하여 혼란이 있을 수 있다. 따라서 한번 정리해보려 한다. 딥러닝에서 view, squeeze, unsqueeze, reshape 는 텐서의 모양을 조작하고 변형하는데 중요한 연산작용을 한다. 이에 대한 각각의 기능과 예제를 통해 알아보자. 1. view (차원 변경) - view는 텐서의 원소의 개수를유지하면서 차원을 조정한다. 아래의 예시를 보면 원본 텐서 생성이 12이고 12의 약수가 3 *4 이다. 따라서 이 원소의 개수를 유지하면서 차원을 변경한 형태이다. import torch # 원본 텐서 생성 x = torch.arange(12) # 텐서의 모양을 (3, 4)로 변경 y = x.view(3,.. 2024. 2. 4.

[머신러닝] LSTM - GRU 란? LSTM(장단기 메모리 네트워크)와 GRU(게이트 순환 유닛)는 시계열 데이터와 자연어 처리 등에서 주로 사용되는 순환 신경망(RNN)의 변형된 형태입니다. LSTM(Long Short-Term Memory) - LSTM은 RNN의 한 종류로, 장기 의존성 문제를 해결하기 위해 고안되었습니다. - 이를 위해 '게이트(gate)'라 불리는 구조를 사용하여 정보의 흐름을 조절합니다. 게이트 구조는 다음 편에서 어떤 건지 알아봅시다. - 입력 게이트, 삭제 게이트, 출력 게이트 등으로 구성되어 각 게이트는 정보를 선택적으로 기억하거나 잊을 수 있도록 합니다. - 기본 RNN과 달리, LSTM은 장기적인 의존성을 학습하고 기억하는 능력이 있어 긴 시퀀스에서 효과적으로 작동합니다. GRU(Gated Recurre.. 2023. 12. 15.

엔비디아 2023 인공지능 컨퍼런스 취소 NVIDIA의 이스라엘 인공지능 정상회의 취소로 안전 우려로 인해 2023년 10월 15일과 16일에 예정된 실제 인공지능 정상회의가 지역 내 불안정한 안전 상황으로 인해 취소되었습니다. 컨퍼런스 취소 사유 NVIDIA는 이스라엘 텔아비브에서 예정된 인공지능 정상회의를 안전 우려로 인해 취소했습니다. 이 지역의 안전 상황이 불안정해진 것이 이 취소의 이유입니다. 참석 예정 인원 및 주요 연설 이 정상회의는 약 2,500명의 연구자와 개발자들이 참석할 예정이었으며, NVIDIA의 CEO Jensen Huang의 주요 연설이 예정되어 있었습니다. 회의 주요 내용 정상회의는 자율 주행 차량, 생성적인 인공지능, 로봇공학, 의료, 오믈니버스, 사이버보안 및 대형 언어 모델을 포함한 다양한 주제에 관한 세션과 워.. 2023. 10. 17.

생성 AI 공격과 방어 전략: 5가지 예측과 대응 생성 AI 공격의 커지는 위협 보안 전문가들은 오랫동안 AI가 자동화된 공격을 수행할 것이라고 경고해왔습니다. 대규모 언어 모델(Large-Language Model, LLM) 생성 AI 도구, 예를 들어 ChatGPT는 현실로 더 가깝게 가져왔습니다. 다크 웹의 도구 악의적 행위자는 이제 악성 코드의 개발을 자동화하는 다크 웹 도구에 액세스할 수 있습니다. 이것은 속성이 계속 변경되는 악성 코드 및 랜섬웨어의 생산을 가속화합니다. 악의적 행위자가 생성 AI를 어떻게 악용할 것인가에 대한 예측 국가는 자체 LLM 개발 ;자금이 풍부한 국가들은 악성 코드 개발에 전념하는 LLM 생성 AI 도구를 만들 수 있습니다. 이는 방어 노력에 큰 도전을 제공합니다. 최고의 범죄 행위자는 도구킷을 개발하고 판매할 것이.. 2023. 10. 13.

Game of Thrones 작가, ChatGPT OpenAI 고발 소송 개요미국의 작가 George RR Martin과 John Grisham은 ChatGPT 소유주인 OpenAI를 상대로 저작권 침해 소송을 제기하였습니다. Martin은 판타지 소설 A Song of Ice and Fire로 유명하며, 이 작품은 HBO의 드라마 Game of Thrones로 채택되었습니다. 이 소송은 ChatGPT와 같은 대형 언어 모델(LLM)이 작가들의 책을 허가 없이 사용하여 ChatGPT를 더 똑똑하게 만들었다는 주장에 근거합니다. 작가들의 저작권 침해 주장소송은 작가들의 소설이 ChatGPT에 의해 허가 없이 사용되었다고 주장하며, 이는 ChatGPT가 이러한 책들을 정확하게 요약할 수 있었기 때문입니다. 또한 이 소송은 미디어 산업 전반에서 발생하는 더 큰 문제를 지적하는.. 2023. 9. 23.

LLM 이란? 언어모델 (GPT) 언어 모델(Language Model)은 자연어 처리(NLP) 분야에서 핵심적인 역할을 합니다. 언어 모델은 주어진 텍스트나 문장에서 다음에 나올 단어나 문장을 예측하거나 생성하는 데 사용됩니다. LLM(대규모 언어 모델, Large Language Model)은 이러한 언어 모델의 대규모한 버전으로, 엄청난 양의 데이터와 매개변수를 사용하여 학습됩니다. 언어 모델의 종류언어 모델은 주로 두 가지 유형으로 나뉩니다. 1) 통계학 기반 언어 모델 통계학 기반 언어 모델은 통계적인 접근을 사용하여 단어 또는 문장의 확률을 예측합니다. 예를 들어, 주어진 단어 시퀀스에서 다음 단어의 확률을 계산하고 가장 높은 확률을 가진 단어를 선택합니다. 이러한 모델은 n-gram 모델과 같이 전통적인 기법을 사용합니다. .. 2023. 9. 15.

이전 1 다음

728x90

티스토리툴바