Personal AI Literacy

직접 쓰는 AI교양

AI 논문, 테크리포트, 서비스 출시 소식 등등을
AI를 활용하지 않는 상태로 직접 읽고 나만의 언어로 요약하는 개인 연재입니다.

AI가 해주는 요약은 빠르고 정확하지만, 결국 휘발성이 심한 지식이 되는 것이 마음에 들지 않았어요

"이게 왜 나왔고, 어떻게 동작하는지, 어떤 장점이 있는지"
를 중심으로 읽습니다.

거의 매일 업데이트
주관적인 관점과 해석을 유지합니다
열린 마음으로 트렌드를 따라가는것이 목적입니다

How I Write

배경지식의 의존성을 최대한 낮추기 위해서 최대한 쉬운 단어와 구어체로 적습니다.
성능보다 맥락과 사용 시나리오를 중요하게 생각합니다
가끔은 단순히 재미있어 보이는 것도 올립니다.

Selected Readings

아래는 지금까지의 연재 중 대표적으로 참고할 만한 글들입니다.

전체 기록은 계속 업데이트되며, 이 목록은 선별·교체됩니다.

구글에서 gemma3의 전 제품군의 작동과정을 볼 수 있는 gemma-scope-2를 공개했습니다. AI는 블랙박스일 수 밖에 없다는 편견에 대한 도전인 것 같고, 안전을 중요시 여기는 기업에서 상세 분석하기 너무 좋은 툴 같네요. Pretrained model을 직접 만들 인프라가 없는 기업에서 참고하기 좋아보여요.

🔗 Gemma Scope 2 - DeepMind Blog

안드레이 카파시가 AI와 함께하는 개발에 대한 본인의 의견을 내비쳤습니다. 단시간에 벌어지는 개발자의 역할에 대한 급격한 변화에 어느 정도 두려움이 있는 것으로 보여요. 저는 오히려 제 혼란을 공감받은 것 같아 안심이 되면서도, 계속 긴장하고 공부해 나가야 한다고 생각했습니다.

🔗 Andrej Karpathy on X

요청을 단순히 여러 번 하는 걸로도 성능이 증가되는걸 확인했다는 논문입니다. 저와 이 논문을 같이 읽으신 분이 한 말씀이 인상적이었어요. "이걸 우리는 퓨샷이라고 하기로 했어요"

🔗 arXiv Paper 2512.14982

오토리그레시브의 품질과, 디퓨전의 속도를 동시에 가져가보겠다는 욕심 가득한 발상이 기반인 NVIDIA의 논문입니다. 토큰 후보들을 뽑는건 디퓨전 방식으로 뽑고, 최종 출력은 순차적으로 뽑아낸다는 아이디어인데요, 모델을 두 가지 모드에 대해 각각 학습시키고, feed forward는 한 번에 하는 방식입니다.

🔗 arXiv Paper 2511.08923

비정형 데이터를 기반으로 리트리벌을 만들고, 하이브리드 서치와 GraphRAG를 지원하며, 리액트와 도구호출이 가능한 에이전트를 만들 수 있는 텐센트의 레포가 공개되었습니다. 이런 류의 레포가 튜토리얼만 돌아가는 경우가 많은데, 텐센트가 잘 정리해준 것 같습니다.

🔗 WeKnora - Tencent GitHub

Ongoing Series

이 연재는 Threads에서 실시간으로 이어지고 있습니다.

👉 전체 연재 보기: Threads 링크