'multimodal' 태그의 글 목록

multimodal

[AI 친해지기] Gemini (7) Gemini 2.0과 실시간 음성 대화, 직접 만들어봅니다

꿈공장장100 2025. 1. 9. 14:06

2025. 1. 9. 14:06

음성대화

안녕하세요! 이번 영상에서는 Gemini 2.0 AI 모델과 실시간 대화를 구현하는 방법을 소개합니다. Python을 사용하여 텍스트 입력을 받고, AI의 텍스트 응답을 출력하는 과정을 단계별로 시연했습니다.

특히 코딩을 몰라도 쉽게 따라할 수 있는 간단한 과정을 준비했으니, 걱정하지 마세요!
이 영상에서는:

Python으로 비동기 함수를 활용하여 실시간 AI와 상호작용하는 방법
Gemini 2.0 모델을 Google Colab 환경에서 사용하는 방법
간단한 코드로 텍스트 기반 AI 대화를 구현하는 방법에 대하여 경험해 봅니다.

여러분도 직접 이 코드를 실행해보고, AI와 대화를 나눠보세요!
궁금한 점이나 개선 아이디어는 댓글로 남겨주세요. 😊

🔗 코드 예제와 실행 환경:
코드 실행을 위해 Python 3.7 이상, Google Colab 또는 Jupyter Notebook을 추천합니다.
복잡한 코딩 없이도 Google Colab에서 바로 실행 가능하니 도전해보세요!

구글코랩 파일 공유

[AI 친해지기] Gemini 2.0과 실시간 음성 대화, 직접 만들어봅니다(공유).ipynb

3.32MB

https://youtu.be/CYTv2WF0Vew?si=hegOvvNDk0DUR_rx

저작자표시 비영리 동일조건

'AI & Business (인공지능과 경영) > Gemini_Google DeepMind' 카테고리의 다른 글

[AI 친해지기] Gemini (6) 기하학(w 멀티모달) 문제도 정복_Gemini 2 0 Thinking Model (0)	2024.12.31
[AI 친해지기] Gemini (5) Gemini 2.0 Thinking Model 활용법 - 한글 사용, 코드 단순화 등 실습 (0)	2024.12.30
[AI 친해지기] Gemini (4) 더 강력한 추론 능력 가진 신모델 Gemini 2 0 Flash Thinking Mode 출시 (2024 12) (0)	2024.12.25
[인공지능 친해지기] Gemini (3) Gemma 살펴보기 - Gemini 기반한 경량 오픈모델 (0)	2024.02.23
[인공지능 친해지기] Gemini_(2) Gemini Advanced 출시-ChatGPT 사용자에게 매력 있나 (0)	2024.02.09

Dream Factory 나만의 서재이자 꿈공장입니다. 꿈은 이루어질 때도 즐겁겠지만 꾸고 있는 동안에도 즐거운 것 같습니다.

[인공지능 친해지기] Meta AI (6) Llama 3.2 🦙 멀티모달 AI의 시작– 텍스트와 이미지를 함께 탐험하기 🖼️💬

꿈공장장100 2024. 10. 18. 12:33

2024. 10. 18. 12:33

Meta에서 텍스트와 이미지 처리가 가능한 첫 번째 오픈소스 AI 모델인 Llama 3.2를 발표했습니다. 이 모델은 경량 버전부터 고성능 멀티모달 모델까지 다양한 형태로 제공됩니다. 이에 대하여 알아보고 텍스트와 이미지를 다루는 방법을 실습을 통하여 경험해 보겠습니다. 감사합니다.

https://youtu.be/DRBJU0TWzkw?si=bZdMqMv1uyRN0pKd

구글코랩 코드

Introducing Multimodal Llama 3.2 (2024).ipynb

3.52MB

저작자표시 비영리 동일조건

'AI & Business (인공지능과 경영) > Meta AI' 카테고리의 다른 글

[인공지능 친해지기] Meta AI (5) 🚀 Llama 3.1을 내 PC에 직접 설치하고 사용하기 (0)	2024.08.18
[인공지능 친해지기] Meta AI (4) 🚀 Llama 3.1 - 오픈 소스로 메타 AI 혁신! 🌍 (0)	2024.08.18
[인공지능 친해지기] Meta AI (3) Llama 2 이해 및 사용 실습 (0)	2024.02.10
[인공지능 친해지기] Meta AI (2) Llama2를 이용한 다양한 프롬프트엔지니어링 실습 (0)	2024.02.04
[Meta AI] (1) SeamlessM4T - ① (바벨탑 붕괴) 세계 여행도 사귐도 자유롭게! 36개 언어 음성 통역 (0)	2023.08.26

Dream Factory 나만의 서재이자 꿈공장입니다. 꿈은 이루어질 때도 즐겁겠지만 꾸고 있는 동안에도 즐거운 것 같습니다.

[인공지능 친해지기] Hugging Face - (22) 데이터 전처리 종합(자연어, 오디오, 이미지, 멀티모달)

꿈공장장100 2024. 4. 20. 15:48

2024. 4. 20. 15:48

이번에는 Hugging Face에서 각종 자연어처리, 오디오, 이미지, 멀티모델 모델에서 데이터를 사용함에 있어 데이터 전처리를 하는 방법에 대하여 종합적으로 살펴보고자 합니다.

감사합니다.

https://youtu.be/RS5w5-Gq5ak

저작자표시 비영리 동일조건

'AI & Business (인공지능과 경영) > AI_Hugging Face' 카테고리의 다른 글

[인공지능 친해지기] Hugging Face (24) AI로 오디오 분류해보기-Wav2Vec2 사용 (0)	2024.05.23
[인공지능 친해지기] Hugging Face - (23) Fine-tune a pretrained model (0)	2024.04.28
[인공지능 친해지기] Hugging Face - (21) UDOP 활용한 비지니스 문서 처리 혁신_Layout Analysis (2)	2024.03.29
[인공지능 친해지기] Hugging Face - (20) AutoClass! 누구나 쉽게 AI모델을 사용하게 해주는 마법 (0)	2024.03.22
[인공지능 친해지기] Hugging Face - (19) 파이프라인 마스터하기: AI모델 쉽게 사용하는 초보자 가이드 (0)	2024.03.10

Dream Factory 나만의 서재이자 꿈공장입니다. 꿈은 이루어질 때도 즐겁겠지만 꾸고 있는 동안에도 즐거운 것 같습니다.

[인공지능 친해지기] ChatGPT (21) 핸드폰 Vision와 Speech로 일상의 Artist 되기

꿈공장장100 2023. 11. 18. 13:15

2023. 11. 18. 13:15

주말 아침 추운 날씨에 창을 닫고 밖의 경치를 찍으며 ChatGPT multimodal 기능을 경험해 보았습니다.

좋은 주말되세요. 감사합니다.

https://youtu.be/tv0AXLTJJbA

저작자표시 비영리 동일조건

'AI & Business (인공지능과 경영) > ChatGPT_Plugins' 카테고리의 다른 글

[인공지능 친해지기] ChatGPT (23) 올해 크리스마스와 신년 카드는 ChatGPT로 해결! (4)	2023.12.05
[인공지능 친해지기] ChatGPT (22) 대출상환 사례로 본 ChatGPT와 Plugin 성능 비교 (0)	2023.11.25
[인공지능 친해지기] ChatGPT (20) 코딩 필요 없는 나만의 GPT 만들어보기 (0)	2023.11.15
[인공지능 친해지기] ChatGPT (19) 또다른 변신 GPT4-Turbo: DevDay에서 발표된 새로운 모델 (2)	2023.11.11
[인공지능 친해지기] Plugin_(18) DALL-E 3에서 이미지 일관성 유지하기 (0)	2023.10.29

Dream Factory 나만의 서재이자 꿈공장입니다. 꿈은 이루어질 때도 즐겁겠지만 꾸고 있는 동안에도 즐거운 것 같습니다.

PREV 이전 1 NEXT 다음

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Dream Factory

multimodal

[AI 친해지기] Gemini (7) Gemini 2.0과 실시간 음성 대화, 직접 만들어봅니다

음성대화

구글코랩 파일 공유

'AI & Business (인공지능과 경영) > Gemini_Google DeepMind' 카테고리의 다른 글

[인공지능 친해지기] Meta AI (6) Llama 3.2 🦙 멀티모달 AI의 시작– 텍스트와 이미지를 함께 탐험하기 🖼️💬

구글코랩 코드

'AI & Business (인공지능과 경영) > Meta AI' 카테고리의 다른 글

[인공지능 친해지기] Hugging Face - (22) 데이터 전처리 종합(자연어, 오디오, 이미지, 멀티모달)

'AI & Business (인공지능과 경영) > AI_Hugging Face' 카테고리의 다른 글

[인공지능 친해지기] ChatGPT (21) 핸드폰 Vision와 Speech로 일상의 Artist 되기

'AI & Business (인공지능과 경영) > ChatGPT_Plugins' 카테고리의 다른 글

+ Recent posts

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역