[인공지능 하드웨어] 8 - Deep Learning HW Accelerator(TPU)
·
AI/AI Hardware
# 들어가며TPU에 대해서 자세히 알아본다. 하드웨어 구현 수준은 아니지만 TPU가 어떻게 행렬 데이터를 다루는지, 그리고 TPU에 얽힌 스토리를 검토해본다. 컴퓨터 구조 관련한 배경지식이 있으면 이해하기 편하므로 글을 읽다가 이해가 되지 않는다면 관련 블로그 포스트나 유튜브를 찾아보는 것이 좋다. 이전 글은 다음 링크의 블로그 포스트를 참고하면 된다. [인공지능 하드웨어] 7 - Winograd Convolution# 들어가며Deep Learning Optimization 기법 중의 하나인 Winograd Convolution에 대해서 알아본다. 컴퓨터 구조 관련한 배경지식이 있으면 이해하기 편하므로 글을 읽다가 이해가 되지 않는다면 관련 블로그kmuhan-study.tistory.com# Google..
[인공지능 하드웨어] 6 - Deep Learning Optimization(Convolution Lowering, Systolic Array)
·
AI/AI Hardware
# 들어가며Matrix Tiling등의 기법을 사용한 GPU Performance Optimization을 중점적으로 알아본다. 컴퓨터 구조 관련한 배경지식이 있으면 이해하기 편하므로 글을 읽다가 이해가 되지 않는다면 관련 블로그 포스트나 유튜브를 찾아보는 것이 좋다. 이전 글은 다음 링크의 블로그 포스트를 참고하면 된다. [인공지능 하드웨어] 5 - GPU Performance Optimization(Matrix Tiling, Tensor Core)# 들어가며Matrix Tiling등의 기법을 사용한 GPU Performance Optimization을 중점적으로 알아본다. 컴퓨터 구조 관련한 배경지식이 있으면 이해하기 편하므로 글을 읽다가 이해가 되지 않는다면 관련 블로kmuhan-study.tist..
[인공지능 하드웨어] 5 - GPU Performance Optimization(Matrix Tiling, Tensor Core)
·
AI/AI Hardware
# 들어가며Matrix Tiling등의 기법을 사용한 GPU Performance Optimization을 중점적으로 알아본다. 컴퓨터 구조 관련한 배경지식이 있으면 이해하기 편하므로 글을 읽다가 이해가 되지 않는다면 관련 블로그 포스트나 유튜브를 찾아보는 것이 좋다. 이전 글은 다음 링크의 블로그 포스트를 참고하면 된다. [인공지능 하드웨어] 4 - GPU Architecture(2)# 들어가며CPU와 GPU의 구조에 대해서 자세하게 배운다. CPU 구조를 조금 더 알아보고 CPU Performance Optimization을 토대로 GPU Performance Optimization을 중점적으로 알아본다. 컴퓨터 구조 관련한 배경지식이kmuhan-study.tistory.com# Introducti..
[인공지능 하드웨어] 4 - GPU Architecture(2)
·
AI/AI Hardware
# 들어가며CPU와 GPU의 구조에 대해서 자세하게 배운다. CPU 구조를 조금 더 알아보고 CPU Performance Optimization을 토대로 GPU Performance Optimization을 중점적으로 알아본다. 컴퓨터 구조 관련한 배경지식이 있으면 이해하기 편하므로 글을 읽다가 이해가 되지 않는다면 관련 블로그 포스트나 유튜브를 찾아보는 것이 좋다. 이전 글은 다음 링크의 블로그 포스트를 참고하면 된다. [인공지능 하드웨어] 3 - GPU Architecture(1)# 들어가며CPU와 GPU의 구조에 대해서 자세하게 배운다. 컴퓨터 구조 관련한 배경지식이 있으면 이해하기 편하므로 글을 읽다가 이해가 되지 않는다면 관련 블로그 포스트나 유튜브를 찾아보는kmuhan-study.tistory..
[인공지능 하드웨어] 3 - GPU Architecture(1)
·
AI/AI Hardware
# 들어가며CPU와 GPU의 구조에 대해서 자세하게 배운다. 컴퓨터 구조 관련한 배경지식이 있으면 이해하기 편하므로 글을 읽다가 이해가 되지 않는다면 관련 블로그 포스트나 유튜브를 찾아보는 것이 좋다. 이전 글은 다음 링크의 블로그 포스트를 참고하면 된다. [인공지능 하드웨어] 2 - DNN Computation# 들어가며DNN(Deep Neural Networks)가 어떻게 계산되는지 알아보고, 하드웨어에서 어떻게 처리될지 행렬 수준에서 이해해 보도록 하자. 이전 글은 다음 링크의 블로그 포스트를 참고하면 된다. [인공kmuhan-study.tistory.com# BackgroundGPU Architecture를 배우기 앞서, 먼저 관련 배경지식을 점검 해야한다.Clock Speed: CPU, GPU의..
[인공지능 하드웨어] 2 - DNN Computation
·
AI/AI Hardware
# 들어가며DNN(Deep Neural Networks)가 어떻게 계산되는지 알아보고, 하드웨어에서 어떻게 처리될지 행렬 수준에서 이해해 보도록 하자. 이전 글은 다음 링크의 블로그 포스트를 참고하면 된다. [인공지능 하드웨어] 1 - Introduction to DNN# 들어가며인공지능 연구가 거듭될수록 하드웨어가 중요해지고 있다. vLLM, CXL 메모리 같이 on-device AI를 위한 새로운 low-level 인공지능 하드웨어 관련 기술이 발전하고 있다. 1. 신경망이 무엇인지kmuhan-study.tistory.com# AI Hardware인공지능 하드웨어의 동향에 대해서 알아보자. 인공지능 하드웨어(GPU)의 종류는 Cloud, Edge로 나눠지며, Edge는 그 쓰임새에 따라서 다른 형태로..