빌런 TOP 20
일간 l 주간 l 월간
1
[컴퓨텍스] [컴퓨텍스 2026] Acer, 한국 시장 재공략의 속도를 신뢰로 바꿀 수 있을까
2
[컴퓨텍스] [컴퓨텍스 2026] LIAN LI, 케이스를 넘어 조립의 순서를 설계하다
3
[컴퓨텍스] [컴퓨텍스 2026] ADATA, 개인용 메모리 브랜드를 넘어 AI·엔터프라이즈 시장으로 확장
4
[컴퓨텍스] [컴퓨텍스 2026] PCCOOLER X 얼티메이크, 발열 제어를 고성능 시스템의 기준까지
5
[이슈/논란] MissAV, 저작권 침해 소송에 직면: 사건 경위 및 성인 스트리밍 업계에 미치는 영향
6
[컴퓨텍스] [컴퓨텍스 2026] Altos, Acer의 AI 서버 전략을 한국 시장으로 가져오다
7
[컴퓨텍스] [컴퓨텍스 2026] Thermal Grizzly Roman 'der8auer' Hartung CEO 인터뷰
8
[컴퓨터] 조텍, 컴퓨텍스 2026 성료… 20주년 한정판부터 게이밍, AI 및 엔터프라이즈 등 라인업 선보여
9
[컴퓨터] [컴퓨텍스 2026] ZOTAC 20주년 특별 전시! 조텍 부스 투어💛 댓글 이벤트 참여하고 대만 현지 기념품도 받아가세요😍
10
[컴퓨텍스] [컴퓨텍스 2026] Leadtek, 쿼드로의 기억을 AI 인프라로 확장하다
11
[컴퓨텍스] [컴퓨텍스 2026] OWC, 크리에이터 장비의 수명을 늘리는 워크플로우 브랜드
12
[일상/생활] 바다표범 잡은 사람의 기쁨
13
[일상/생활] 반올림피자 점주 막말 논란
14
[이벤트] [진행] 빌런 댓글학원 개강, 6월 한 달
15
[컴퓨텍스] [컴퓨텍스 2026] Apacer, 산업용 신뢰성을 게이밍과 Edge AI에 적용
16
[컴퓨터] 엔비디아 ‘컨트롤 레조넌트’ 등 최신 게임에 DLSS 적용 확대
17
[일상/생활] 4000번 출석체크한 뉴비가 간절해요
18
[일상/생활] 인도 남성 고환 폭발 사연
19
[이슈/논란] 아시안게임 야구대표팀 최종 명단
조텍 프래그마타 게임 번들
엔비디아가 구글 딥마인드(Google DeepMind)의 디퓨전젬마(DiffusionGemma)를 엔비디아 지포스(NVIDIA GeForce) RTX GPU, 엔비디아 RTX PRO 플랫폼, 엔비디아 DGX 스파크(DGX Spark) 시스템 전반에서 더욱 빠르게 실행할 수 있도록 최적화했다고 밝혔다. 이를 통해 로컬 PC부터 클라우드 환경까지 폭넓은 활용이 가능해졌다. 디퓨전젬마는 텍스트를 한 번에 한 단어씩 생성하는 대신 여러 단어를 병렬로 생성해 텍스트 블록 전체를 출력한다. 이를 통해 개발자와 연구자, AI 애호가들이 일상적으로 사용하는 단일 사용자 워크로드에서 혁신적인 저지연 AI 경험을 제공한다. 디퓨전젬마의 주요 특징은 다음과 같다. - 병렬 생성: 디퓨전젬마는 토큰을 한 번에 하나씩 예측하는 대신, 단계마다 최대 256개의 토큰을 디노이징한다. - 젬마(Gemma) 4 기반으로 구축: 디퓨전젬마는 젬마 4를 기반으로 구축됐다. 이는 260억 개의 파라미터를 갖춘 전문가 혼합(Mixture-of-Experts, MoE) 모델이다. 단계마다 38억 개의 파라미터를 활성화하며, 구글의 젬마 4 아키텍처에 디퓨전 헤드를 결합했다. - 최대 4배 향상된 성능: 단일 사용자 생성 환경에서 일반적으로 발생하는 지연 현상을 줄여 로컬 하드웨어에서도 빠른 텍스트 생성을 지원한다. - 오픈 로컬 실행: 디퓨전젬마는 아파치(Apache) 2.0 라이선스 기반의 오픈 웨이트 모델로 제공되며, RTX와 DGX 스파크에서 완전히 실행된다. 클라우드나 토큰당 비용이 필요 없으며, 허깅페이스 트랜스포머(Hugging Face Transformers), vLLM, 언슬로스(Unsloth)에서 기본 지원된다. 새로운 텍스트 생성 방식 오늘날 널리 사용되는 대부분의 거대 언어 모델(large language model, LLM)은 자기회귀(autoregressive) 방식으로 작동한다. 이는 새로운 단어가 이전 단어에 의존하는 형태로, 텍스트를 토큰 단위로 하나씩 순차적으로 생성하는 방식이다. 이러한 순차적 생성 과정 때문에 대화형 AI는 마치 글자를 입력하는 것처럼 응답한다. 디퓨전젬마는 이와 다른 방식을 채택했다. 디퓨전젬마는 젬마 4 26B 전문가 혼합 아키텍처를 기반으로 구축돼, 디퓨전 모델이 이미지를 생성하는 방식과 같이 텍스트를 생성한다. 즉, 노이즈에서 시작해 텍스트 블록 전체를 한 번에 정제한다. 단일 토큰을 생성한 뒤 다음 토큰을 계산하기 위해 대기하는 대신, 각 단계에서 최대 256개의 토큰을 병렬로 디노이징한다. 그 결과, 디퓨전젬마는 텍스트를 순차적으로 생성하는 대신 블록 단위로 처리하는 모델이 됐다. 이러한 병렬 처리 방식은 레이턴시에 민감한 단일 사용자 작업에서 개발자의 사고와 반복 속도에 발맞춘 빠른 응답을 제공한다. 대화형 채팅, 에이전틱 루프, 계획과 실행을 수행하는 온디바이스 어시스턴트와 같은 작업이 여기에 해당된다. 엔비디아 GPU에서 더욱 강력해진 디퓨전젬마 토큰을 한 번에 하나씩 생성하는 방식은 본질적으로 메모리의 영향을 크게 받는다. 기존 LLM은 대부분의 시간을 연산 수행이 아닌 메모리 대역폭 대기에 사용하기 때문에 컴퓨팅 자원을 충분히 활용하지 못한다. 디퓨전 방식은 이러한 구조를 뒤바꾼다. 256개 토큰으로 구성된 전체 블록을 트랜스포머를 통해 병렬로 처리하는 워크로드는 컴퓨팅 성능에 의해 좌우된다. 여기서 엔비디아 GPU가 두각을 드러낸다. 엔비디아 텐서 코어(Tensor Core)는 대규모 병렬 연산을 가속하며, 쿠다(CUDA) 소프트웨어 스택은 별도의 튜닝 없이도 초기부터 모델의 효율적 실행을 지원한다. 이와 같이 디퓨전젬마는 GPU의 강점을 최대한 활용하도록 설계됐다. 이러한 장점은 실제 성능에서도 확인된다. 디퓨전젬마는 단일 엔비디아 H100 텐서 코어 GPU에서 초당 1,000개 토큰, 엔비디아 DGX 스파크에서 초당 150개 토큰, 엔비디아 DGX 스테이션(DGX Station)에서 최대 초당 2,000개 토큰의 성능을 제공한다. 이는 동일한 단일 사용자 환경에서 실행되는 동급 자기회귀 모델 대비 약 4배 빠른 수준이다. 이러한 성능상의 이점은 엔비디아의 제품군 전반에서 제공된다. - 엔비디아 DGX 스파크 데스크사이드 개인용 AI 슈퍼컴퓨터에서 로컬 실행: 128GB 통합 메모리를 탑재한 엔비디아 GB10 그레이스 블랙웰 슈퍼칩(Grace Blackwell Superchip) 기반으로 구동되며, 프로토타이핑, 파인튜닝, 완전한 로컬 에이전트 워크플로우를 위한 엔비디아 AI 소프트웨어 스택이 사전 설치돼 있다. - 엔비디아 RTX PRO 6000 워크스테이션에서 실행: 개발자와 연구자, AI 전문가는 전문 워크플로우의 일부로 로컬 저지연 생성과 에이전틱 루프가 실행할 수 있는 충분한 성능 여유를 제공한다. - DGX 스테이션에서 실행: 748GB의 통합(coherent) 메모리를 기반으로, 저지연 텍스트 생성과 에이전틱 루프를 위해 초당 최대 2,000토큰의 업계 최고 수준의 로컬 고속 추론 성능을 제공한다. - 지포스 RTX GPU에서 실행: 향후 라마.cpp(llama.cpp) 지원이 추가될 예정이다. 로컬 환경에서 시작하기 허깅페이스 트랜스포머를 활용하면 모델을 가장 빠르게 테스트하고 프로토타이핑할 수 있다. 이는 지포스 RTX 5090 또는 DGX 스파크에서 별도 설정 없이 디퓨전젬마 실행을 기본 지원한다. 더 높은 처리량의 추론이 필요한 경우에는 vLLM을 활용하면 된다. 특정 작업이나 도메인에 맞게 모델을 적용하려는 경우, 언슬로스와 엔비디아 네모(NeMo) 프레임워크를 통해 파인튜닝을 수행할 수 있다. 또한 로컬 환경을 신속하게 실행할 수 있도록 사전 구성된 DGX 스파크 플레이북도 제공된다. DGX 스파크, RTX PRO, DGX 스테이션용 vLLM 플레이북은 현재 열람 가능하다. 허깅페이스에서 디퓨전젬마를 직접 사용해 보거나, build.nvidia.com에서 엔비디아가 호스팅하는 애플리케이션 프로그래밍 인터페이스를 통해 무료로 테스트할 수 있다. 아키텍처와 로컬 배포에 대해 더 자세히 알아보려면 엔비디아 기술 블로그와 구글 딥마인드 발표를 참고하면 된다. RTX AI 개러지 최신 업데이트 사항 - 엔비디아 연구진이 SANA-WM을 공개했다. 이는 단일 이미지와 카메라 경로만으로 정밀한 6-DoF 제어가 가능한 720p 해상도의 1분 길이 비디오를 생성하는 오픈소스 월드 모델이다. 26억 개 파라미터 규모의 증류 버전은 NVFP4 포맷을 활용해 단일 지포스 RTX 5090 GPU에서 34초 만에 60초 분량의 비디오를 생성할 수 있다. 이는 단일 GPU에서 실행되면서도 유사한 오픈 모델 대비 최대 36배 높은 처리량을 제공한다. 여기에서 관련 논문을 확인할 수 있다. - 윈도우(Windows) 에이전트 구축 환경이 한층 강화됐다. 엔비디아와 마이크로소프트(Microsoft)는 기본 윈도우 환경에서 활용 가능한 턴키 에이전트 샌드박싱 기능을 공개했다. 이는 마이크로소프트 실행 컨테이너(eXecution Containers)와 엔비디아 오픈쉘(OpenShell) 런타임을 제공하는 동시에, 에이전틱 추론 속도를 최대 2배 향상시키고 헤르메스 에이전트(Hermes Agent)의 기본 윈도우 지원을 추가했다. - DGX 스파크는 개봉 후 몇 분 만에 에이전트를 실행할 수 있는 환경을 제공한다. 간소화된 엔비디아 네모클로(NemoClaw) 설치 과정을 통해 개발자는 로컬 에이전트를 빠르게 활용할 수 있으며, 큐원(Qwen) 3.6-35B는 vLLM에서 최대 2.6배 빠르게 실행된다. 또한 엔비디아 싱크(Sync)의 새로운 클러스터 어시스턴트는 최대 4대의 DGX 스파크를 하나의 512GB 풀로 연결해 약 4,000억 개 파라미터 규모의 모델을 실행할 수 있다.
2026.06.13
4
5
사파이어는 최대 16코어 AMD 라이젠 AI 맥스+ 395 "스트릭스 헤일로" APU와 데스크톱급 외장 그래픽 카드에 버금가는 강력한 라데온 8060S GPU를 탑재한 새로운 게이밍 미니 PC를 공개했습니다. '사파이어 엣지 AI 맥스+ 395' 라는 이름의 이 고성능 게이밍 미니 PC는 무려 16개의 풀 코어 Zen 5 프로세서와 32개의 스레드를 갖춘 강력한 AMD 라이젠 AI 맥스+ 395 "스트릭스 헤일로" APU로 구동됩니다. 적절한 냉각 시스템만 갖춰진다면, 이 강력한 APU는 24코어 인텔 코어 울트라 9 285HX CPU와 같은 다른 고급 CPU와도 충분히 경쟁할 수 있습니다. 물론, Strix Halo 제품군의 가장 큰 장점은 강력한 내장 그래픽(iGPU)으로, 게이밍 미니 PC에 탁월한 선택이 될 수 있다는 점입니다. Ryzen AI Max+ 395 APU는 RDNA 3.5 기반의 40개 컴퓨트 유닛(CU)을 갖춘 인상적인 Radeon 8060S iGPU를 탑재하여 Nvidia GeForce RTX 4070 노트북 GPU와 동등한 수준의 성능을 제공합니다. 사파이어 엣지 미니 PC는 최대 128GB의 LPDDR5X RAM을 장착할 수 있으며, 이 RAM은 내장 그래픽(iGPU)에서도 활용 가능합니다. 따라서 일반적인 소비자용 GPU처럼 VRAM 용량이 제한적인 환경에서는 불가능한 LLM(Layered Logging Machine) 작업을 시스템에서 로컬로 실행할 수 있습니다. 사파이어는 USB-C로 연결된 두 대의 미니 PC를 동시에 구동하는 시연도 선보였습니다. 이를 통해 리소스를 공동으로 활용할 수 있어, 더 큰 규모의 LLM(Local Load Management) 시스템을 로컬에 배포하는 것이 가능해집니다. 미니 PC 여러 대를 직렬로 연결하여 리소스를 공유할 수 있습니다. 더욱 강력한 성능을 원하는 사용자라면 이 장치를 여러 대 연결하여 더욱 복잡한 로컬 LLM(Local Light Machine) 환경을 구축할 수도 있습니다. 현재 가격 및 출시 일정은 불확실하지만, 사파이어는 Strix Halo가 탑재된 게이밍 미니 PC를 2026년 컴퓨텍스에서 공식 공개할 예정입니다. GMKtec Evo-X2 미니 PC의 가격이 약 2,700달러인 점을 고려하면 , Sapphire Edge AI Max+ 395도 비슷한 가격대에 출시될 것으로 예상됩니다. https://www.computerbase.de/news/mainboards/sapphire-x-ryzen-ai-max-plus-395-zusammenschaltbare-mini-pcs-mit-strix-halo-fuer-riesige-llms.96492/
2026.03.12
0
1
블룸버그 보도에 따르면, 애플은 개편된 버전의 시리를 테스트하기 위해 엔지니어들을 대상으로 ChatGPT와 유사한 앱을 설계했다. 다만 이 시리 앱은 일반에 공개되지 않고 내부 테스트용으로만 활용될 예정이다. 이 앱은 맥락 이해 능력 강화, 앱 내·앱 간 작업 수행 확대, 개인 데이터와의 깊은 통합 등 애플이 계획 중인 새로운 시리 기능을 시험하는 데 쓰이고 있다. 앱의 형태는 다른 챗봇 애플리케이션과 유사하며, 주제별 대화를 구분해 여러 대화를 관리할 수 있다. 또한 과거 대화를 기억하고 참조할 수 있으며, 확장된 대화도 지원한다. 애플은 iOS 18 출시 이후 더 똑똑한 버전의 시리를 개발해왔다. 당초 ‘Apple Intelligence 시리’를 업데이트에 포함해 공개할 계획이었지만, 자사 기준에 미치지 못해 2026년으로 기능 공개를 연기했다. 결국 해당 계획은 폐기됐고, 애플은 LLM(대규모 언어 모델) 전환을 가속화하기 위해 시리를 2세대 아키텍처로 전면 개편하기로 했다. 새롭게 선보일 시리는 ChatGPT, Claude, Gemini 등 최신 AI 챗봇과 유사한 고도화된 LLM을 활용한다. 이를 통해 연속적인 대화 유지, 인간에 가까운 답변 제공, 더 복잡한 작업 수행 등이 가능해질 전망이다. 애플은 2026년 초 iOS 26.4 업데이트(3월 공개 예상)와 함께 LLM 버전 시리를 출시할 계획이다. 이는 당초 목표했던 일정보다 1년 늦은 공개다. 또한 내년 말에는 시리의 디자인을 새롭게 선보일 예정인데, 맥의 파인더 로고와 비슷한 ‘휴머노이드’ 스타일이 될 가능성이 거론된다. 애플은 앤스로픽, 오픈AI, 구글 등과 논의를 진행해왔으며, 자사 모델이 아닌 외부 파트너사의 기술을 활용해 새로운 시리를 구동할 가능성도 있는 것으로 알려졌다. https://www.macrumors.com/2025/09/26/apple-llm-siri-app/
2025.09.27
6
1
삼성이 현실 업무 생산성에 초점을 맞춘 AI 벤치마크 ‘TRUEBench(Trustworthy Real-world Usage Evaluation Benchmark)’를 공식 발표했다. 삼성리서치가 개발한 TRUEBench는 대규모 언어 모델(LLM)이 실제 직장 환경에서 얼마나 생산적으로 작동하는지를 평가하기 위해 설계됐으며, GPT-5가 첫 리더보드에서 선두를 기록했다. TRUEBench는 기존 벤치마크가 가진 한계를 정면으로 겨냥했다. 기존 평가 방식은 단순한 질의응답 구조와 영어 중심의 테스트에 치우쳐 실제 업무 환경을 충분히 반영하지 못한다는 지적이 있었다. 삼성은 이를 개선하기 위해 10개 평가 카테고리와 46개 세부 항목, 12개 언어(한국어 포함), 그리고 2,485개 테스트 세트를 마련했다. 이 테스트는 짧게는 8자에서 길게는 2만 자 이상에 이르는 요청을 포함해, 단순 질의부터 대규모 문서 요약에 이르는 다양한 난이도를 아우른다. 평가 과정도 차별화됐다. TRUEBench는 단순히 정답 여부를 따지지 않고, 사용자가 명시하지 않은 암묵적 요구 조건까지 충족하는지를 고려한다. 평가 기준은 사람과 AI의 협업으로 다듬어진다. 먼저 사람이 기준을 세우고, AI가 이를 검토해 오류와 모순을 찾아내면 다시 사람이 보완하는 과정을 반복한다. 이렇게 교차 검증된 기준을 토대로 AI 자동 평가가 이루어지며, 모든 조건을 충족해야 통과할 수 있어 세밀하고 일관된 점수가 산출된다. 삼성리서치는 이번 발표에서 “실제 업무 환경에서의 AI 활용 경험을 바탕으로 한 TRUEBench가 생산성 평가의 표준을 제시하고, 삼성의 기술적 리더십을 강화할 것”이라고 강조했다. 특히 GPT-5가 초기 리더보드에서 가장 높은 점수를 기록해, 향후 경쟁 모델과의 비교에서도 중요한 기준점이 될 것으로 전망된다. TRUEBench의 데이터 샘플과 리더보드, 평균 응답 길이 정보는 오픈소스 플랫폼 허깅페이스(Hugging Face)에서 공개되며, 최대 5개의 모델을 동시에 비교할 수 있다. 이로써 기업과 개발자는 성능과 효율성을 한눈에 파악하며 모델 선택에 참고할 수 있을 것으로 보인다. 삼성은 TRUEBench가 단순한 성능 수치 이상의 현실적 지표를 제공해, 업무 환경에 최적화된 AI 모델을 선별하고 발전시키는 데 중요한 역할을 할 것으로 기대하고 있다. 구경하러가기. https://huggingface.co/spaces/SamsungResearch/TRUEBench
2025.09.25
0
0
인텔 코어 울트라5
  • 종합
  • 뉴스/정보
  • 커뮤니티
  • 질문/토론