대화로 이미지 만드는 시대가 시작됐다!

"한글"도 이미지에서 완벽 재현! 

 

이글은 최근 더 진보된 GPT 4o의 이미지 생성의 기능을 중점으로 봅니다. 예를 들어 최근 유행하는 '지브리풍 그림'도 아래 기능의 극히 한가지 사례로 아래 사례를 하시면서 단순히 '지브리풍'으로 요청하면 됩니다. 특히 아래의 (5) 사용자 이미지 기반 생성 방법입니다. 사실 지브리풍은 그저 하나의 사례일 뿐 더 큰 변화와 발전이 있어 저는 만족하게 더 많이 사용할 것 같습니다.


✅ 개요: "언어 모델이 그림도 그린다고?"

OpenAI는 오랫동안 이미지 생성이 언어 모델의 핵심 능력 중 하나라고 강조해왔습니다. 그리고 2025년 3월, 드디어 그 철학이 현실화되었습니다.

GPT-4o는 단순한 텍스트 생성기를 넘어, 음성, 이미지, 텍스트를 모두 이해하고 만들어내는 진정한 ‘Omni-modal AI’로 진화했습니다.

그 중심에는 바로 여기에서 소개할 “4o 이미지 생성 기능”이 있습니다.

“이제는 그냥 설명만 하면, 그림이 그려집니다.”
그것도 실제 같은 고해상도 이미지부터, 만화, 메뉴판, 간판까지 모두 포함해서요.


🧠 GPT-4o 이미지 생성의 주요 특징

GPT-4o의 이미지 생성은 이전 세대인 DALL·E 3에 비해 확연히 발전했습니다. 단순히 보기 좋은 그림이 아니라, 실제로 사용할 수 있는 이미지를 생성합니다.

기능 설명
정확한 텍스트 표현 표지판, 메뉴, 초대장 등 텍스트 중심 이미지도 깨끗하게 구현
포토리얼리즘 실제 사진처럼 사실적인 질감과 구도 생성
대화형 수정 가능 “배경을 밤으로 바꿔줘”, “조금 더 귀엽게” 같은 수정이 자연어로 가능
다중 객체 생성 10~20개의 서로 다른 요소를 논리적으로 조합해 표현 가능
사용자 이미지 기반 생성 업로드한 이미지를 분석해 변형하거나 영감을 받아 재창작
지식과 이미지 통합 “뉴턴의 프리즘 실험 다이어그램 그려줘”처럼 배경지식 기반 이미지 생성 가능

🖼️ 주요 기능별 대표 시연 사례 모음

GPT-4o 이미지 생성 기능의 강점을 실감할 수 있도록, 각 기능별로 대표적인 시연 프롬프트와 기대 포인트를 정리했습니다.

✅ ① 정확한 텍스트 표현

🟡 기능 설명: 표지판, 메뉴, 초대장 등 텍스트 중심 이미지도 깨끗하게 구현

 

🎨 프롬프트 예시:

“뉴욕 브루클린 거리의 표지판에 ‘Broom Parking for Witches Not Permitted in Zone C’와 ‘Magic Carpet Loading Only (15 minutes)’ 등 재미있는 문구가 적혀 있고, 두 마녀가 간판을 바라보는 장면. 현실적인 거리 사진 스타일로 그려줘.”

 

✨ 기대 포인트:

  • 복잡한 텍스트가 표지판에 제대로 표현되는지
  • 오탈자 없이 균형 있게 배치되는지
  • 인물/배경/텍스트 간 구도 조화

🪧 [실전 예시] 간판 속 텍스트도 정확하게 들어갈까?
📷 마녀들이 바라보는 뉴욕 거리 표지판 이미지

 

 

🎨 (추가) 한글 프롬프트:

"뉴욕 브루클린의 거리 풍경.

가로등 기둥에 다음과 같은 재미있는 표지판이 붙어 있다:

• ‘마녀 빗자루 주차 금지 – C구역 제한’

• ‘마법 양탄자 하차 전용 (15분 제한)’

그 앞에서 두 마녀가 표지판을 바라보고 있는 장면.

현실적인 거리 사진 스타일로, 표지판의 글씨가 또렷하게 보이도록 그려줘."

 

📷 (추가: 표지판이 한글인 경우) 마녀들이 바라보는 뉴욕 거리 "한글" 표지판 이미지

 


✅ ② 포토리얼리즘

🟡 기능 설명: 실제 사진처럼 사실적인 질감과 구도 생성

 

🎨 프롬프트 예시:

“햇살이 비치는 창가의 카페.
나무 테이블 위에 커피 한 잔과 열린 노트북, 작은 화분이 놓여 있음.
벽에는 따뜻한 조명이 켜져 있고, 조용한 분위기.
DSLR 스타일의 고화질 포토리얼 사진으로 그려줘.”

 

 기대 포인트:

  • 포토카메라 질감, 아웃포커스, 고급스러운 조명
  • 테이블과 주변 소품들의 세밀한 표현력
  • 현실적이고 따뜻한 분위기, 자연스러운 색감

📸 [실전 예시] 진짜 사진처럼 보일까? – 카페 속 한 장면
📷 햇살이 비치는 창가의 카페 이미지


✅ ③ 대화형 수정 가능

🟡 기능 설명: "배경을 밤으로 바꿔줘", "조금 더 귀엽게" 같은 수정이 자연어로 가능

 

🎨 프롬프트 흐름 예시:

1️⃣ "따뜻한 햇살이 비치는 창가에서 책을 읽는 고양이의 그림을 그려줘. 스타일은 수채화처럼 부드럽게 해줘."
2️⃣ "고양이에게 둥근 안경을 씌워줘."
3️⃣ "창밖 배경을 밤하늘로 바꿔줘. 별이 반짝이게 표현해줘."
4️⃣ "고양이가 미소 짓게 해줘. 눈도 살짝 감긴 느낌으로 부탁해."
5️⃣ "이 이미지를 일본 애니메이션 스타일로 바꿔줘."
6️⃣ "이 이미지를 투명 배경으로 다시 그려줘. PNG 형식으로 만들어줘."
7️⃣ "하늘을 나는 고양이와 로봇이 손잡고 구름 위에서 춤추는 장면을 상상해서 그려줘. 미래적인 배경으로 해줘."

 

✨ 기대 포인트:

  • 컨텍스트 유지 능력
  • 이미지 구성 요소의 자연스러운 변경
  • ‘재생성’이 아닌 ‘맥락 유지형 수정’인지 확인

💬 [실전 예시] 대화하듯 이미지 수정해보기 – 고양이

 

📷 1단계

본 이미지: 따뜻한 햇살이 비치는 창가에서 책을 읽는 고양이의 수채화 스타일 그림


📷 2단계

  • 소품 추가: 고양이에게 둥근 안경을 씌운 이미지

📷 3단계

  • 배경 변경: 창밖 배경을 밤하늘로 바꾸고 별이 반짝이게 표현한 이미지

📷 4단계

정 표현 변경: 고양이가 미소 짓고 눈을 살짝 감은 모습


📷 5단계

  • 스타일 변경: 일본 애니메이션 스타일로 바꾼 이미지

 


📷 6단계

  • 투명 배경: 투명 배경으로 고양이를 다시 그린 이미지

📷 7단계

  • 창의적 생성: 하늘을 나는 고양이와 로봇이 손잡고 구름 위에서 춤추는 장면 (미래적인 배경)


이렇게 각 단계별로 이미지를 자연스럽게 수정하고 추가하여 대화형 수정 기능을 실험할 수 있습니다. 위와 같은 흐름을 따라가면서 고양이의 모습, 배경, 감정 표현 등을 자유롭게 수정할 수 있습니다.


✅ ④ 다중 객체 생성

🟡 기능 설명: 10~20개의 서로 다른 요소를 논리적으로 조합해 표현 가능

🎨 프롬프트 예시:

“4행 4열로 배열된 16개 오브젝트의 이미지: 파란 별, 빨간 삼각형, 초록 사각형, 분홍 원, 오렌지 모래시계, 보라색 무한대 기호, 흑백 도트 나비넥타이, 타이다이 숫자 42, 오렌지 고양이, 보물지도, 눈알 스티커, 따봉 이모지, 가위, 파란 기린, OpenAI라는 필기체 글자, 무지개 번개.”

✨ 기대 포인트:

  • 각 객체가 식별 가능하게 분리되어 있는지
  • 의미 혼동 없이 다양한 모양/색상이 구분되는지
  • 배열 구조와 배경의 정렬력

🧩 [실전 예시] 다양한 요소, 한 화면에 담을 수 있을까?
📷 4x4 오브젝트 배열 이미지 삽입 위치

 

🧩 [추가 실전 예시] 한글 로고 요청

“4행 4열로 배열된 16개 오브젝트의 이미지: '꿈공장장'이라는 로고, 파란 별, 빨간 삼각형, 초록 사각형, 분홍 원, 오렌지 모래시계, 보라색 무한대 기호, 흑백 도트 나비넥타이, 타이다이 숫자 42, 오렌지 고양이, 보물지도, 눈알 스티커, 따봉 이모지, 가위, 파란 기린, OpenAI라는 필기체 글자.”
📷 한글로고 요청 (약간 오류 발생) - 오류 예: 위치, 모래시계, 화분, 42 등


✅ ⑤ 사용자 이미지 기반 생성

🟡 기능 설명: 업로드한 이미지를 분석해 변형하거나 영감을 받아 재창작

 

🎨 예시 흐름:

  • 원본 이미지: 손그림 자동차 도면 업로드
  • 프롬프트:

“이 도면을 바탕으로 뉴욕 거리에서 주행 중인 모습으로 바꿔줘. 포토리얼 스타일로.”

✨ 기대 포인트:

  • 원본 이미지에서 도출한 구조/구도를 이미지에 반영했는지
  • 업로드 이미지의 ‘창의적 전환 능력’ 평가
  • 맥락 있는 재구성 능력

📷 자동차 도면 업로드 → 주행 중 이미지 


✅ ⑥ 지식과 이미지 통합

🟡 기능 설명: 배경지식을 활용한 시각화

 

🎨 프롬프트 예시:

“아이작 뉴턴이 프리즘을 이용해 햇빛을 분해하는 장면을 다이어그램 스타일로 그려줘. 프리즘, 빛의 경로, 색상 스펙트럼이 모두 포함되어야 함.”

 

✨ 기대 포인트:

  • 과학적 개념을 시각적으로 얼마나 정확히 표현하는지
  • GPT-4o가 ‘지식’을 이미지에 어떻게 반영하는지
  • 교육용 자료로서의 신뢰도

🔬 [실전 예시] 과학 개념도 시각화할 수 있을까?
📷 뉴턴의 프리즘 실험 다이어그램 이미지

 

* 이 결과 우측 하단에 이상한 영문이 나타나, 다시 요청함


 

🎯 무엇이 가능할까? 활용 분야 예시

GPT-4o 이미지 생성은 단순한 예술적 창작을 넘어, 실제 업무와 일상 속에서 유용하게 활용 가능한 이미지 제작 도구로 확장되고 있습니다. 아래는 대표적인 활용 분야입니다:

  • 📚 교육자료: 과학 실험 다이어그램, 역사적 장면 재현, 수학 공식 시각화
  • 💼 실무 디자인: 프레젠테이션 인포그래픽, 포스터, 워크숍 초대장
  • 🎮 게임 및 캐릭터 디자인: 인게임 UI, NPC 콘셉트 시안, 설정화
  • 📣 마케팅/광고: SNS 카드뉴스, 이벤트 배너, 고급 메뉴판
  • 🎨 창작 예술: 일러스트, 풍자 만화, 철학적 개념 이미지화

“아이디어만 있으면, GPT-4o가 그림으로 실현해줍니다.”

 

🧙‍♂️ [실전 예시] 게임 콘셉트 디자인도 말로 된다!

🎨 프롬프트 예시: 게임 콘셉트 시

🎨 추천 프롬프트: 게임 콘셉트 시안 (재미 요소 포함)

“미래의 디지털 마법사가 등장하는 RPG 게임의 캐릭터 설정화.
전신이 보이는 구도, 배경은 네온이 흐르는 디지털 마법 도시.
마법사는 한 손에 고양이 모양의 홀을 들고 있고, 머리에는 전자 회로 무늬가 있는 망토를 쓰고 있다.
오른쪽 상단에는 'HP / MP' 막대가 표시되어 있고, 아래에는 마법 아이콘 4개가 UI처럼 배치되어 있음.
스타일은 고퀄리티 콘셉트 아트 느낌으로.”

 


📷 GPT-4o로 만든 '디지털 마법사 RPG' 콘셉트 이미지


⚠️ 아직은 이런 점이 아쉽다

완벽하진 않습니다. GPT-4o 이미지 생성도 몇 가지 기술적 한계를 안고 있습니다.

항목 문제 설명

이미지 자르기 포스터나 세로형 이미지에서 하단이 잘리는 현상
환각 (Hallucination) 문맥이 부족하거나 모호한 경우, 실제에 없는 요소를 생성
다국어 표현 한글이나 아랍어 등 비라틴 문자의 정확도가 떨어질 수 있음
정밀 수정 어려움 특정 부위만 바꾸려는 경우, 주변까지 변형되는 사례 발생
작은 텍스트 표현 글자가 작거나 많으면 흐려지거나 왜곡될 수 있음

🔄 OpenAI는 사용자 피드백을 반영해 지속적인 개선을 예고했으며, 특히 "텍스트 렌더링 정확도", "정밀 편집 기능"은 우선순위로 강화 중.


🔐 안전한 이미지 생성을 위한 정책

GPT-4o 이미지 생성 기능은 단순한 AI 창작 도구가 아닌, 책임 있는 생성 시스템으로 설계되었다고 합니다. OpenAI는 다음과 같은 강력한 안전장치를 도입했다고 합니다.

  • C2PA 메타데이터 자동 삽입
    → 생성된 이미지에 "AI 생성 이미지"라는 디지털 워터마크 포함 (추적 가능)
  • 실존 인물 보호 정책 강화
    → 미성년자, 민감 인물에 대한 포토리얼 생성 제한
  • 유해 콘텐츠 차단
    → 폭력, 혐오, 성적 묘사 등은 생성 전 단계에서 차단됨
  • 입력-출력 동시 모니터링 시스템
    → LLM 기반 정책 해석으로 부적절한 요청 감지 및 차단

안전성과 창의성의 균형을 맞추는 것이 GPT-4o의 핵심 전략이라고 함.


🛠️ 어떻게 사용할 수 있을까?

GPT-4o 이미지 생성은 지금 바로 ChatGPT에서 사용할 수 있습니다. 다음은 사용자별 접근 경로입니다.

사용자 유형 접근 가능 여부
ChatGPT Plus / Pro / Team / Free 사용자 GPT-4o 기본 이미지 생성기로 사용 가능 (웹/앱)
Enterprise / Edu 계정 순차적 적용 예정
개발자 (API) 2025년 봄부터 이미지 생성 API 지원 예정
기존 DALL·E 사용자 별도 GPT 또는 인터페이스로 병행 사용 가능

 

📌 사용 방법 요약

  1. 텍스트로 원하는 이미지를 설명
  2. 색상(hex 코드), 해상도, 비율, 배경 등 세부 요청 가능
  3. 이미지 생성에는 약 30초~1분 소요

💬 예시:

“조용한 시골 기차역의 플랫폼. 벤치 위에 여행 가방과 종이컵 커피, 책이 놓여 있고, 배경에는 지나가는 기차가 흐릿하게 보인다. 전체 색감은 부드러운 아이보리 톤(#F5F5DC), 비율은 3:2, 해상도는 1920x1280. DSLR 느낌의 포토리얼 이미지로 표현해줘.”


📌 요약

GPT-4o의 이미지 생성 기능은 더 이상 ‘재미용 그림 그리기 AI’가 아닙니다.
이제는 “대화형 비주얼 사고 도구”로 완전히 진화했습니다.

  • 대화만으로도 복잡한 이미지를 생성할 수 있고,
  • 직관적인 수정이 가능하며,
  • 업무, 교육, 창작 등 실질적 영역에서 활용 가능성이 열려 있습니다.

🖌️ “누구나 디자이너가 될 수 있습니다. 단, 말로!”

 

 

마지막으로 위의 '요약'을 주제로 다음과 같은 프롬프트로 이미지를 생성해 보았습니다.

(프롬프트 예시)

“커다란 디지털 화이트보드 앞에 서 있는 사람.
그 사람은 손에 펜 대신 마이크를 들고 있고,
화이트보드에는 ‘말풍선’에서 나온 설명이 이미지로 실시간 변환되고 있다.
왼쪽엔 프롬프트 예시가 텍스트로 떠 있고, 오른쪽엔 포스터, 게임 캐릭터, 다이어그램, 만화 같은 시각 자료들이 떠오르고 있음.
상단에는 문구처럼: ‘말로 그리는 세상’, 하단에는 ‘GPT-4o 이미지 생성 – 누구나 디자이너가 될 수 있습니다.’
전반적으로 따뜻한 톤, 현대적인 디자인 감각, 16:9 비율의 개념 일러스트 스타일로.”

→ 약간의 한글 오타(예: 세상, 만화)는 있으나 이 정도면 정말 좋아졌네요!

 


🎬 유튜브 동영상

📺 관련 유튜브 콘텐츠입니다!

https://youtu.be/HLpCzp5VdbU

 

본 유튜브 동영상 썸네일도 완전히 GPT 4o로 만들었습니다.

 

감사합니다.😊


  •  

OpenAI o3-mini: 비용 효율적 AI 추론의 새 시대를 열다

2025년 1월 31일, OpenAI는 새로운 인공지능 모델 o3-mini를 공식 출시했습니다. ChatGPT 및 API에서 즉시 사용 가능한 이 모델은 뛰어난 비용 효율성과 강력한 추론 능력을 결합하여 AI 기술의 새로운 기준을 제시하고 있습니다. 특히, 과학(STEM), 수학, 코딩 등 기술적 도메인에서 탁월한 성능을 발휘하면서도, 기존 모델보다 더 빠르고 저렴하게 제공된다는 점에서 주목받고 있습니다.


1. OpenAI o3-mini의 핵심 특징

① 강력한 STEM 능력과 합리적인 비용

o3-mini는 특히 과학, 수학, 코딩과 같은 기술 분야에서 강력한 성능을 자랑합니다. 기존 OpenAI o1-mini 대비 더 높은 수준의 추론 능력을 제공하면서도, 지연 시간(latency)이 줄어들고 비용이 낮아졌습니다.

2024년 12월 프리뷰 당시부터 주목받았던 이 모델은, 작은 모델이 도달할 수 있는 성능의 한계를 확장하는 데 집중했습니다. 실제로, OpenAI의 테스트 결과에 따르면 o3-mini는 고난도의 실전 문제에서도 기존 모델보다 더 정확하고 명확한 답변을 생성하는 것으로 평가되었습니다.

② 프로덕션 준비 완료: 새로운 개발자 기능 지원

o3-mini는 OpenAI의 소형 추론 모델 중 최초로 아래와 같은 기능을 지원합니다.

  • 함수 호출 (Function Calling): 개발자가 AI와의 상호작용을 보다 정교하게 제어 가능
  • 구조화된 출력 (Structured Outputs): JSON 등의 구조화된 데이터 형식으로 결과 제공
  • 개발자 메시지 (Developer Messages): 프로덕션 환경에서 보다 실용적인 AI 사용 가능

이를 통해, o3-mini는 단순한 AI 챗봇을 넘어 실제 비즈니스 및 소프트웨어 개발 환경에서 즉시 활용할 수 있는 모델로 자리 잡을 준비가 되었습니다.

③ 스트리밍 및 사용자 맞춤형 추론 강도 선택

o3-mini는 스트리밍(streaming)을 지원하며, 개발자는 상황에 맞춰 추론 강도(Reasoning Effort)를 조절할 수 있습니다.

  • 낮음(Low): 빠른 응답이 필요한 경우
  • 중간(Medium): 속도와 정확성의 균형을 유지
  • 높음(High): 복잡한 문제 해결 시 깊이 있는 추론 가능

이 옵션을 통해, 개발자는 응답 속도와 정확도 사이에서 최적의 균형을 찾을 수 있습니다. 특히, 고난도 문제를 해결해야 하는 경우 o3-mini의 고추론(High reasoning) 모드를 활용하면 더욱 강력한 성능을 발휘합니다.

④ 비전 기능 미지원, 하지만 검색 기능 추가

o3-mini는 이미지 인식(비전) 기능을 지원하지 않으므로, 시각적 데이터를 분석하려면 기존 OpenAI o1 모델을 사용해야 합니다. 그러나, 새롭게 추가된 검색 기능을 통해, o3-mini는 최신 정보를 찾아 관련 웹 링크와 함께 제공할 수 있습니다. 이는 OpenAI가 추론 모델에 검색 기능을 통합하려는 초기 단계로, 향후 더욱 발전할 것으로 예상됩니다.


2. OpenAI o3-mini의 성능: 기존 모델과의 비교

① 수학 및 과학 문제 해결 능력 향상

o3-mini는 수학 및 과학 시험에서 기존 모델보다 더 높은 정확도를 기록했습니다.

📌 경쟁 수학 (AIME 2024)

  • o3-mini(High) 버전의 정확도: 83.6% (기존 모델 대비 대폭 향상)

📌 박사 과정 수준의 과학 문제 (GPQA Diamond)

  • o3-mini(High) 버전의 정확도: 77.0% (기존 모델보다 우수한 성능)

📌 고급 수학 문제 (FrontierMath)

  • Python 도구 활용 시, 32% 이상의 문제를 첫 시도에서 해결
  • 도전적인 문제(T3)의 28% 이상 해결

이러한 성과는 o3-mini가 고급 수학과 과학 분야에서도 경쟁력 있는 성능을 발휘한다는 점을 보여줍니다.

② 경쟁 프로그래밍 및 소프트웨어 엔지니어링

o3-mini는 경쟁 프로그래밍(Codeforces) 및 소프트웨어 엔지니어링(SWE-bench) 평가에서도 뛰어난 성과를 보였습니다.

📌 경쟁 프로그래밍 (Codeforces)

  • o3-mini(High)의 Elo 점수: 2073 (기존 모델 대비 대폭 향상)

📌 소프트웨어 엔지니어링 (SWE-bench)

  • SWE-bench Verified 테스트에서 48.9% 정확도로 최고 성능 달성

이러한 결과는 o3-mini가 단순한 대화형 AI를 넘어, 실제 소프트웨어 개발 환경에서도 활용 가능함을 보여줍니다.


3. ChatGPT 및 API에서의 접근 가능성

① ChatGPT Plus, Team, Pro 사용자 대상 즉시 제공

ChatGPT Plus, Team, Pro 사용자는 오늘부터 즉시 o3-mini를 사용할 수 있으며, Enterprise 사용자에게는 2월부터 제공됩니다.

특히, 이번 업데이트를 통해 Plus 및 Team 사용자들의 메시지 한도가 50개에서 150개로 증가했습니다.

② 무료 사용자도 체험 가능

무료 사용자도 메시지 작성기에서 ‘Reason’ 모드를 선택하거나 응답을 다시 생성하면 o3-mini를 체험할 수 있습니다. 이는 OpenAI가 무료 사용자에게 추론 모델을 공개한 최초의 사례입니다.


4. OpenAI o3-mini의 미래와 의미

o3-mini의 출시는 AI 모델의 성능을 유지하면서도 비용을 줄이는 새로운 혁신 방향을 제시합니다. OpenAI는 GPT-4 출시 이후 토큰당 비용을 95% 절감했으며, 이번에도 고품질 AI를 더욱 저렴하게 제공하기 위해 노력하고 있습니다.

🔹 앞으로 기대할 점

  • AI 추론 모델에서 검색 기능이 점점 더 강화될 가능성
  • 비용 대비 효율적인 AI 도입이 점점 더 쉬워질 것
  • 기술 도메인(STEM, 코딩 등)에서 AI의 역할 확대

o3-mini는 단순한 AI 모델이 아니라, 비용 효율성과 고성능을 동시에 제공하는 AI의 새로운 기준을 제시하고 있습니다. 앞으로 OpenAI가 어떤 혁신을 이어나갈지 기대됩니다.

📌 여러분은 o3-mini를 어떻게 활용할 계획인가요? 의견을 댓글로 남겨주세요! 🚀

 

OpenAI가 2024.10.31일 ChatGPT search 기능을 공개하였습니다. 아직 개선될 부분은 많으나 사용자가 기대했던 인공지능 사용 방향으로 또 하나 실현되는 부분을 보게 되었습니다. 시간이 지나면서 검색시장의 판도도 바뀔 수 있을 것 같습니다. 직접 실습을 통하여 기능을 살펴 보았습니다. 감사합니다.

https://youtu.be/gBVfl5Ed0q4?si=Q-9Y-jXnNzhSRSiv

이 동영상에서는 사업보고서 분석, 가상자산 가격 현황 등에 대하여 LlamaParse와 ChatGPT를 사용하여 데이터를 추출하고 이를 기반으로 추론하는 실습을 해보았습니다. 직장인, 회계사, 증권애널리스트, 학생, 교수 등 많은 이들에게 유용한 기능으로 생각됩니다. 감사합니다.

- LlamaParse는 생성형 AI(GenAI) 기반 문서 파싱 플랫폼으로, 대규모 언어 모델(LLM)과 이를 활용한 다양한 응용 프로그램을 위해 설계된 솔루션입니다. LlamaParse의 핵심 목표는 데이터를 파싱하고 정리하여, 고품질 데이터를 제공하는 것입니다. 이렇게 준비된 데이터는 RAG(Retrieval-Augmented Generation)와 같은 고급 LLM 사용을 위해 필수적인 부분이 됩니다.

 

https://youtu.be/Yc2inuEcCPE?si=UXSNgkY4UoLF4vFd

 

ChatGPT와 LlamaIndex를 활용하여 AI Agent를 구현하여 주식 정보 등을 검색하는 것에 사용해 보았습니다. AI를 통하여 복잡한 코드나 데이터를 이해하지 않아도 일상언어를 통하여 관련 작업을 할 수 있는 경험을 같이 해보시면 좋을 것 같습니다. 더욱 AI가 실생활과 우리 업무에 가까워지는 것을 느끼게 됩니다.

감사합니다.

 

https://youtu.be/zQvzxXG-0Eo

 

 

2024년 ChatGPT는 4-omni가 소개되면서 더 성능이 좋아진 것 같습니다. 그래서 ChatGPT를 통해 회계에 활용해 보았습니다. 우선 "감가상각"이 제대로 이해하고 되는지 보았습니다. 감사합니다. 

 

 

https://youtu.be/oUE0Ek1dWjM

 

OpenAI는 새로운 플래그십 모델 GPT-4o를 2024년 5월 13일 발표했습니다. GPT-4o는 텍스트, 오디오, 이미지 입력을 받아 그에 대한 출력도 텍스트, 오디오, 이미지로 생성할 수 있는 모델입니다. 이를 통해 AI는 더욱 인간과 소통하는 것이 자연스러워질 것으로 보이고 이는 향후 다양한 AI 활용에 있어 중요한 변화를 가져오는 계기가 될 것으로 보입니다. 감사합니다. 

 

https://youtu.be/4HhvBqbPCsg?si=1VYoblErFURaZVvh

 

 

OpenAI가 오늘 새로운 소식을 전했습니다. 기술적으로는 이미 가능한 것이었지만 드디어 ChatGPT와 DALL-E를 통하여 DALL-E의 이미지를 일반 사용자가 직접 편집할 수 있는 기능을 배포하였습니다. 한번 여러분들도 직접 해보시면 재미있을 것 같습니다.

감사합니다.

 

https://youtu.be/InYfdOYb8Ao

 

 

 

2024.2.8일 구글에서 Gemini Advanced를 출시했습니다. 

과연 어떠한 장점이 있을까요? ChatGPT 사용자에게는 어떠한 매력을 줄 수 있을까요? 한번 생각해 보았습니다.

감사합니다.

 

https://youtu.be/2rbLDZ30Li4

 

GPT Store로 더욱 많은 새로운 아이디어와 상품이 나오고 있습니다. 오늘 여행은 GPT 중에서 동영상을 제작하는 과정을 탐방해보고자 합니다. 아직은 부족한 부분은 있으나 이러한 상품의 발전과 함께 경쟁 속에서 소비자에게는 더욱더 좋은 서비스가 낮은 가격으로 제공되기를 바랍니다.

감사합니다.

 

https://youtu.be/f7Fvgqv8GLY

 

+ Recent posts