본문 바로가기

전체 글408

Open WebUI - 기본 Open WebUI is an extensible, feature-rich, and user-friendly self-hosted AI platform designed to operate entirely offline. It supports various LLM runners like Ollama and OpenAI-compatible APIs, with built-in inference engine for RAG, making it a powerful AI deployment solution.설치https://docs.openwebui.com 🏡 Home | Open WebUIOpen WebUI is an extensible, feature-rich, and user-friendly self-host.. 2025. 3. 19.
LiteLLM - 다양한 LLM API 통합 관리 (본 게시물은 ChatGPT를 통해 작성되었습니다.)https://www.litellm.ai LiteLLMLLM Gateway (OpenAI Proxy) to manage authentication, loadbalancing, and spend tracking across 100+ LLMs. All in the OpenAI format.www.litellm.ai LiteLLM은 다양한 LLM(대형 언어 모델) API를 통합하여 쉽게 사용할 수 있도록 도와주는 Python 라이브러리입니다. OpenAI API와 호환되도록 설계되어 있어, OpenAI, Anthropic(Claude), Google(Gemini), Mistral, Cohere, Ollama 등의 다양한 모델을 같은 방식으로 호출할 수 있습니.. 2025. 3. 18.
SillyTavern https://docs.sillytavern.app What is SillyTavern? | docs.ST.appSillyTavern - LLM Frontend for Power Usersdocs.sillytavern.appSillyTavern은 AI 캐릭터와의 인터랙티브 채팅을 위한 프론트엔드 애플리케이션으로 다양한 대형 언어 모델(LLM) API를 하나의 통합된 인터페이스로 제공하는 강력한 사용자 인터페이스을 제공합니다.1. 가상 캐릭터와의 인터랙션역할극(Roleplay, RP): 다양한 가상의 캐릭터를 생성하고, 해당 캐릭터와 대화하면서 이야기(스토리)를 만들어갈 수 있습니다.텍스트 기반 RPG: 게임 스타일의 대화를 통해 자신만의 모험을 즐길 수 있습니다.창작 및 소설 작업: AI와 협업하여 캐릭.. 2025. 3. 18.
Gartner 보고자료로 살펴보는 2025년 트렌드 변화 (본 게시글은 Gartner의 hype cycle 2024, 2025 자료를 참고하여 ChatGPT를 통해 작성되었습니다.)2025년의 변화는 2024년과 비교하여 여러 측면에서 중요한 발전과 도전이 예상됩니다.  1. 생성형 AI(GPT 등)의 발전 단계 변화 • 2024년에는 생성형 AI(GenAI)가 높은 기대를 받으며 급속도로 발전했지만, 2025년에는 일부 기술이 “환멸의 계곡(Trough of Disillusionment)” 단계로 접어드는 것으로 보입니다.• 사용자는 AI의 실제 비즈니스 가치, 비용, 정확성 등에 대해 더 많은 고민을 하게 될 것입니다.• AI 관련 기업들은 수익성 문제와 비즈니스 모델 확립을 위해 도전하는 시기가 될 것으로 전망됩니다. 2. 주요 AI 기술 트렌드 • AI.. 2025. 3. 18.
Figma를 Bolt.new로 쉽게 옮기는 방법 Figma 작업물을 Bolt.new에서 빠르게 열 수 있는 간단한 방법이 있습니다. 별다른 설정 없이, URL만 수정하면 됩니다.방법기존 Figma URL을 확인합니다.예시: https://www.figma.com/design/pfHSDy3kxexEiryfvidddddddd/위 URL의 맨 앞에 bolt.new/를 추가합니다.변경 후: https://bolt.new/www.figma.com/design/pfHSDy3kxexEiryfvidddddddd/브라우저에 변경된 URL을 입력하고 이동합니다.결과변경된 URL로 접속하면 Bolt.new에서 Figma 파일을 열 수 있습니다. 만약 정상적으로 작동하지 않더라도 입력 창이 나타나므로, 추가적인 안내에 따라 진행하면 됩니다.주의 사항현재 일부 사용자에게 오.. 2025. 3. 16.
MCP: 모델 컨텍스트 프로토콜(Model Context Protocol) Introduction - Model Context Protocol Introduction - Model Context ProtocolUnderstand how MCP connects clients, servers, and LLMsmodelcontextprotocol.io 모델 컨텍스트 프로토콜(Model Context Protocol, MCP)은 AI 애플리케이션이 대형 언어 모델(LLM)과 다양한 데이터 소스 및 도구를 표준화된 방식으로 연결할 수 있도록 설계된 개방형 프로토콜입니다. 이는 마치 USB-C 포트가 다양한 주변 기기와 액세서리를 표준화된 방식으로 연결하는 것과 유사합니다.  MCP의 주요 특징은 다음과 같습니다:표준화된 통합: MCP는 다양한 데이터 소스와 도구에 대한 사전 구축된 통합.. 2025. 3. 16.
음성비서 : SesameAI의 CSM, Kyutai의 Moshi SesameAILabs - CSMGitHub - SesameAILabs/csm: A Conversational Speech Generation Model GitHub - SesameAILabs/csm: A Conversational Speech Generation ModelA Conversational Speech Generation Model. Contribute to SesameAILabs/csm development by creating an account on GitHub.github.comgithub에 있는 코드로 진행 할 경우 PyTorch의 cpu 버전이 설치 된다.(csm) D:\workspace\csm>pip install torchtritonERROR: Could not find a v.. 2025. 3. 16.
Kroki - 텍스트 기반 다이어그램 (본 게시글은 ChatGPT를 기반으로 작성되었습니다.)https://kroki.io Kroki!Kroki provides a unified API with support for BlockDiag (BlockDiag, SeqDiag, ActDiag, NwDiag, PacketDiag, RackDiag), BPMN, Bytefield, C4 (with PlantUML), D2, DBML, Ditaa, Erd, Excalidraw, GraphViz, Mermaid, Nomnoml, Pikchr, PlantUML, Structurizr, SvgBob, Skroki.io 프로젝트를 진행하면서 복잡한 비즈니스 로직이나 시스템 아키텍처를 설명해야 할 때, 다이어그램이나 흐름도를 직접 그려본 적 있으신가요?문서화 부.. 2025. 3. 14.
풀스택 AI 서비스 (본 게시글은 Chatgpt의 o1 이성 처리 기능을 활용하여 작성되었습니다.)1. 풀스택 AI 서비스 개념 개요“AI 서비스를 위한 풀스택(Full Stack)”이라 함은, 단순히 모델 개발만을 의미하는 것이 아니라 데이터 수집-정제 → 모델 개발 및 학습 → 서비스 배포 → 모니터링 및 재학습에 이르는 전 과정을 포괄적으로 다루는 것을 의미합니다.2025년 기준으로 대부분의 기업 및 조직에서는 아래의 단계를 통합적으로 구성하여 효율적인 MLOps(Machine Learning Operations) 파이프라인을 구축하고 있습니다.데이터 레이어: 데이터 인프라 및 파이프라인, 데이터 레이크/웨어하우스, ETL/ELT(추출-변환-적재)AI 모델 개발 레이어: 모델 아키텍처 설계, 학습/추론 환경, 모델 검.. 2025. 3. 14.
오픈소스 기반의 CDP 구축 예시 L모 사의 CDP 구성을 보고 오픈 소스로 구성한다면 어떻게 될까 생각하며 작성해 본다.오픈소스 기반의 CDP 구축 솔루션 예시CDP 아키텍처 구성 요소오픈 소스 솔루션데이터 수집 (Data Ingestion)Apache Kafka, Flink, Airbyte데이터 저장 및 처리 (Data Storage & Processing)Hive, Druid, Delta Lake, Trino, ClickHouse고객 데이터 통합 (Identity Resolution)dbt, OpenMetadata데이터 분석 및 세분화 (Customer Segmentation & Insights)Apache Superset, Metabase, Scikit-learn개인화 마케팅 및 자동화 (Activation & Personaliz.. 2025. 3. 14.
Reverse Proxy 솔루션 비교 AI Eco System: AI 관련된 오픈소스들을 통합하여 시스템 구축**Web Proxy**ApplicationStorageWorkflowSecurityGovernance(본 게시글은 Perplexity의 심층 연구 기능을 활용하여 작성되었습니다.)사내 Reverse Proxy 솔루션 비교: HAProxy, Nginx, Traefik리버스 프록시는 내부 시스템과 외부 클라이언트 사이에서 중요한 역할을 담당하며, 로드 밸런싱, SSL 종료, 캐싱, 라우팅 등 핵심 기능을 제공합니다. 이 보고서에서는 세 가지 주요 리버스 프록시 솔루션인 HAProxy, Nginx, Traefik을 최신 트렌드를 포함하여 자세히 비교합니다.각 솔루션 개요HAProxyHAProxy(High Availability Proxy.. 2025. 3. 14.
Perplexity 1년 무료 사용 방법 과거 SKT에 이어 NH투자증권에서 해외 언론사, 투자 분석 플랫폼, 커뮤니티 정보까지 필요한 정보만 쏙쏙 찾아보시라고 Perplexity를 1년 무료로 풀었습니다. NH투자증권의 이벤트 페이지에서 2025년 3월 11일에 등록된 "AI로 똑똑하게 투자하자!" 들어가셔서 이용권 등록하기 클릭하시면 됩니다. 본 프로모션은 NH투자증권 고객 모두 참여 가능하며, 한정 수량 으로 진행되므로 수량 소진 시 자동 종료 됩니다.Perplexity 이용권은 선택하신 Perplexity 계정(이메일 주소) 에 적용됩니다. 단 이미 PRO 계정이 있으신 경우 다른 계정(이 메일 주소)을 선택해주세요.이미 사용중인 고객은 중복 등록 되지 않습니다.고객 당 1개의 고유 프로모션 코드가 제공되며, 1회만 등록 가능 하오니 유.. 2025. 3. 13.