[인공지능 하드웨어] 5 - GPU Performance Optimization(Matrix Tiling, Tensor Core)
·
AI/AI Hardware
# 들어가며Matrix Tiling등의 기법을 사용한 GPU Performance Optimization을 중점적으로 알아본다. 컴퓨터 구조 관련한 배경지식이 있으면 이해하기 편하므로 글을 읽다가 이해가 되지 않는다면 관련 블로그 포스트나 유튜브를 찾아보는 것이 좋다. 이전 글은 다음 링크의 블로그 포스트를 참고하면 된다. [인공지능 하드웨어] 4 - GPU Architecture(2)# 들어가며CPU와 GPU의 구조에 대해서 자세하게 배운다. CPU 구조를 조금 더 알아보고 CPU Performance Optimization을 토대로 GPU Performance Optimization을 중점적으로 알아본다. 컴퓨터 구조 관련한 배경지식이kmuhan-study.tistory.com# Introducti..
[인공지능 하드웨어] 4 - GPU Architecture(2)
·
AI/AI Hardware
# 들어가며CPU와 GPU의 구조에 대해서 자세하게 배운다. CPU 구조를 조금 더 알아보고 CPU Performance Optimization을 토대로 GPU Performance Optimization을 중점적으로 알아본다. 컴퓨터 구조 관련한 배경지식이 있으면 이해하기 편하므로 글을 읽다가 이해가 되지 않는다면 관련 블로그 포스트나 유튜브를 찾아보는 것이 좋다. 이전 글은 다음 링크의 블로그 포스트를 참고하면 된다. [인공지능 하드웨어] 3 - GPU Architecture(1)# 들어가며CPU와 GPU의 구조에 대해서 자세하게 배운다. 컴퓨터 구조 관련한 배경지식이 있으면 이해하기 편하므로 글을 읽다가 이해가 되지 않는다면 관련 블로그 포스트나 유튜브를 찾아보는kmuhan-study.tistory..
[인공지능 하드웨어] 3 - GPU Architecture(1)
·
AI/AI Hardware
# 들어가며CPU와 GPU의 구조에 대해서 자세하게 배운다. 컴퓨터 구조 관련한 배경지식이 있으면 이해하기 편하므로 글을 읽다가 이해가 되지 않는다면 관련 블로그 포스트나 유튜브를 찾아보는 것이 좋다. 이전 글은 다음 링크의 블로그 포스트를 참고하면 된다. [인공지능 하드웨어] 2 - DNN Computation# 들어가며DNN(Deep Neural Networks)가 어떻게 계산되는지 알아보고, 하드웨어에서 어떻게 처리될지 행렬 수준에서 이해해 보도록 하자. 이전 글은 다음 링크의 블로그 포스트를 참고하면 된다. [인공kmuhan-study.tistory.com# BackgroundGPU Architecture를 배우기 앞서, 먼저 관련 배경지식을 점검 해야한다.Clock Speed: CPU, GPU의..
[인공지능 하드웨어] 2 - DNN Computation
·
AI/AI Hardware
# 들어가며DNN(Deep Neural Networks)가 어떻게 계산되는지 알아보고, 하드웨어에서 어떻게 처리될지 행렬 수준에서 이해해 보도록 하자. 이전 글은 다음 링크의 블로그 포스트를 참고하면 된다. [인공지능 하드웨어] 1 - Introduction to DNN# 들어가며인공지능 연구가 거듭될수록 하드웨어가 중요해지고 있다. vLLM, CXL 메모리 같이 on-device AI를 위한 새로운 low-level 인공지능 하드웨어 관련 기술이 발전하고 있다. 1. 신경망이 무엇인지kmuhan-study.tistory.com# AI Hardware인공지능 하드웨어의 동향에 대해서 알아보자. 인공지능 하드웨어(GPU)의 종류는 Cloud, Edge로 나눠지며, Edge는 그 쓰임새에 따라서 다른 형태로..
[인공지능 하드웨어] 1 - Introduction to DNN
·
AI/AI Hardware
# 들어가며인공지능 연구가 거듭될수록 하드웨어가 중요해지고 있다. vLLM, CXL 메모리 같이 on-device AI를 위한 새로운 low-level 인공지능 하드웨어 관련 기술이 발전하고 있다. 1. 신경망이 무엇인지 알아보고 구현하기, 2. 코드/알고리즘을 사용한 가속화, 3. 간단한 NPU 설계를 다루도록 한다.# Introduction to DNN### 인공지능의 요즘 트렌드1. 더 정확해지고 있다2. 사이즈(가중치 행렬 등)이 커지고 있다3. 급속하게 복잡하고 비용이 비싸지고 있다4. 이에 따라서 다양한 칩이 개발되며 출시되고 있다 vLLM이라던지, 하드웨어 가속기라던지 요즘 서버나 반도체 시장의 규모가 커지는데에는 이유가 있다. 인공지능 없이 살수 없게 된 사람들은 같은 성능의 인공지능이라도..