AI & Business (인공지능과 경영)/AI_Hugging Face 34

[AI친구] Hugging Face - Hugging Face와 Google Colab을 통한 데이터셋 직접 접근

데이터 분석가 및 AI 연구자들을 위한 흥미로운 소식이 있습니다. Hugging Face와 Google Colab을 통한 데이터셋 직접 접근 Hugging Face와 Google Colab을 통한 데이터셋 직접 접근이 가능합니다. Hugging Face와 Google Colab의 통합: 이 새로운 기능을 통해 사용자들은 Google Colab 노트북에서 Hugging Face에 호스팅된 70,000개 이상의 데이터셋에 직접 접근할 수 있습니다. 이 통합은 데이터 과학 및 AI 연구에서 데이터 접근을 더욱 원활하고 효율적으로 만드는 중요한 진전입니다. hf:// URL을 통한 간단한 접근: 사용자들은 이제 간단한 hf:// URL 형식을 사용하여 Hugging Face의 데이터셋에 접근할 수 있습니다. 이..

[인공지능 친해지기] Hugging Face - (15) 다국어 개체명 인식 ⑥ Fine Tuning

NER에서 기존 동영상에 이어 관련 모델에 대한 Fine Tuning을 하는 과정에 대하여 살펴보았습니다. 감사합니다. https://youtu.be/gTfhCuO0mUY #huggingface, #개체명인식, #NER , #finetuning, #자연어성능측정 , #transformer , #미세조정, #KS회계보험계리컨설팅 , #KS경영인공지능연구소, #인공지능

[인공지능 친해지기] Hugging Face (15) 다국어 개체명 인식 ③ 토큰 분류를 위한 사용자 정의 모델링

Hugging FaceTransformers 라이브러리는 사용자가 특정 목적에 맞춰 기존의 사전 훈련된 모델을 쉽게 수정하고 확장할 수 있도록 지원합니다. 이를 통해 사용자는새로운 모델을 처음부터 전부 구현하지 않고도, 기존 모델의 구조와 가중치를 활용하여 필요한 목표를 달성할 수 있는 맞춤형 모델을 효율적으로 만들 수 있습니다. https://youtu.be/2GYGAfVr6VE

[인공지능 친해지기] Hugging Face - (15) 다국어 개체명 인식_② 다국어트랜스포머와 XLM-R토큰화

XLM-R (Cross-lingual Language Model - RoBERTa)은 다국어 트랜스포머 모델로, 여러 언어의 데이터를 학습하여 다양한 언어 간의 자연어 처리 작업을 수행할 수 있습니다. XLM-R은 mBERT의 후속 모델로, 더 큰 사전 훈련 말뭉치와 개선된 훈련 방법을 사용하여 더 높은 성능을 제공합니다. XLM-R 등에서 사용되는 SentencePiece 토큰화 등에 대하여 살펴보겠습니다. https://youtu.be/hZWxaBq7ebI