본문 바로가기

분류 전체보기52

크리스마스 뉴욕 여행기 - Day2 (베슬, 하이라인, 피터루거, 소호) 안녕하세요!! 🙋‍♂️ 크리스마스 뉴욕 여행기 2일차입니다! 사는게 바쁘다보니 두번째 글을 너무 늦게 쓰게 되었네요 ㅜㅜㅜ 2일차 여행 경로1. Vessel2. Highline Park3. Peter Luger Steak House (워크인 실패 😞)4. Apollo Bagels - 뉴욕 최고 베이글 맛집! 🤩5. Soho & Noho 6. La Cabra 7. Union Square Holiday Market 0. Pier 83https://maps.app.goo.gl/My7g5NrSCaNjPSvt5 Pier 83 Midtown · W 42nd St &, 12th Ave, New York, NY 10036 미국★★★★★ · 페리/국내여객선www.google.com 사실 여행의 첫 시작은 Pie.. 2026. 1. 7.
크리스마스 뉴욕 여행기 - Day1 (첼시 마켓, 휘트니 미술관, 콘반 뉴욕) 안녕하세요!! 🙋‍♂️ 원래 블로그에 AI 관련 내용만 올리고 있었지만..사진 찍기와 여행도 취미로 하고 있고 이번에 크리스마스 기념으로 뉴욕 여행을 다녀온 기억이 너무 좋아서 추억을 기록할 겸, 크리스마스에 뉴욕을 방문하시는 분들께 도움도 드리고자 글을 작성하게 되었습니다! 최대한 기억이 생생할 때 작성하려고 피곤하지만 공항에서 집에 도착하자마자 바로 노트북을 열고 작성을 시작했습니다 🧑‍💻 구글맵 공유 🗺️우선 제가 이번 뉴욕 여행을 계획하면서 찍어놓은 모든 구글맵의 장소들 공유드립니다!! 제가 가려고 했던 모든 장소들을 다 살펴보실 수 있어요!! https://maps.app.goo.gl/TMgKUq1viMWnQeYT9 2025 크리스마스 뉴욕 여행 · Kyushik Min80 places.. 2025. 12. 27.
[Axolotl] 1. Axolotl로 언어 모델 파인튜닝하기 👋 시작하며안녕하세요! Axolotl (아홀로틀)은 위의 그림에 있는 굉장히 귀여운 수중 생물인데요! 이 axolotl과 같은 이름을 가지는 AI 모델 학습 도구가 있습니다. 최근 이 Axolotl을 사용하여 언어 모델 학습과 최적화를 수행하고 있는데 개인적으로 굉장히 좋은 도구라고 생각해서 이를 사용하는 방법을 정리해서 블로그 글을 작성해보려고 합니다. Axolotl은 복잡한 LLM 미세조정(fine-tuning)을 훨씬 쉽고 유연하게 할 수 있도록 도와주는 오픈소스 프레임워크입니다. Hugging Face Transformers, LoRA, Quantization 등의 기술을 한데 모아 다양한 하드웨어 환경에서 자유롭게 설정할 수 있다는 점이 큰 장점입니다! 💪 앞으로 axolotl을 사용한.. 2025. 7. 17.
Flutter에 에러 기록을 위한 Sentry 적용하기 0. Sentry란??Sentry는 앱이나 웹서비스에서 오류와 성능 문제를 자동으로 추적해주는 모니터링 플랫폼입니다!앱을 배포하고 나면 사용자의 핸드폰에서 발생하는 오류들을 개발자가 직접 추적하는 것이 불가능합니다. 하지만 Sentry를 사용하면 사용자의 환경에서 발생한 다양한 예외, 앱 멈춤, 느려짐과 같은 현상들을 실시간으로 수집하고 원인, 발생 위치 등을 개발자가 빠르게 파악할 수 있게 도와줍니다! 👍Sentry는 Flutter, Andriod, iOS, 웹 등 다양한 플랫폼을 지원합니다.1. Sentry 가입 및 기초 설정먼저 https://sentry.io/welcome/ 페이지로 이동 후 오른쪽 위의 Get Started를 클릭한 다음 계정을 생성합니다. 다음으로 모니터링 할 플랫폼 선택합.. 2025. 7. 13.
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits 논문 링크: https://arxiv.org/pdf/2402.177640. Abstract최근 BitNet과 같은 연구들이 새로운 1-bit LLM (Large Language Model)의 시대를 위한 길을 닦고 있음본 논문에서는 1-bit LLM의 변형인 BitNet b1.58을 제안!LLM의 모든 파라미터를 {-1, 0, 1}의 세 값 중 하나로 설정대기 시간 (latency), 메모리, 처리량 (throughput), 에너지 소모에 대해 아주 비용 효율적동일한 크기의 FP16이나 BF16 트랜스포머 모델과 비교했을 때 perplexity나 세부 문제들 (end-task)에 대해 유사한 성능을 보임또한 1.58 bit LLM은 다음의 두가지를 정의새로운 스케일링 법칙 (Scaling Law)성능도 .. 2025. 7. 6.
Searching Latent Program Spaces 논문 링크: https://arxiv.org/pdf/2411.08706깃허브: https://github.com/clement-bonnet/lpn0. AbstractProgram Synthesis는 주어진 입출력 쌍에 대해 이를 설명할 수 있는 프로그램을 자동으로 생성하는 문제기존 접근 방식기호 기반 (symbolic) 접근조합 탐색 공간 (combinatorial search space)이 커지는 경우 풀기 어려움인공 신경망 기반 접근인공신경망을 사용하여 프로그램 구조에 대한 분포를 학습하고 탐색 공간을 줄여 효율성을 향상시킴하지만 어려운 문제에 대해서는 한번에 (one-shot) 프로그램 합성을 하는 것이 어려움 → test-time search가 추가적으로 필요하지만 대부분의 신경망 기반 접근은 추.. 2025. 6. 29.
반응형