YomiToku에서 만화 OCR 사용

 

1. YomiToku

YomiToku  로컬 서버에서 실행 가능하며 일본어 문서에 특화된 OCR 및 문서 이미지 분석을 수행하는 Python 패키지입니다.

 

https://note.com/kotaro_kinoshita/n/n70df91659afc

 

日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました|Kotaro.Kinoshita

はじめに 最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。 しかし、その多くは日本語を

note.com

일본어에 특화된 OCR, 문서 이미지 해석 Python 패키지 「YomiToku」를 공개했습니다. YomiToku는 PDF 및 카메라로 촬영한 문서 이미지를 분석하기 위한 Python 패키지입니다.

 

 

(추가내용)
일본어 => 한국어 번여을 통하여 응용범위가 있을 것으로 생가됩니다.

 


2. Google Colab에서 실행

'Google Colab'에서 수행하는 단계는 다음과 같습니다.

(1) 패키지 설치.

 

# 패키지 설치
!pip install yomitoku

 

 

(2) 가장 왼쪽의 폴더 아이콘으로 파일 목록을 열고 " sample.png "를 업로드합니다.

 

 

・sample.png

 

 

(3) OCR 실행.

# OCR
!yomitoku sample.png -f md -o results -v --figure

 

 


·${path_data}
 : 해석 대상의 이미지가 포함된 디렉토리나 이미지 파일의 경로를 직접 지정해 주세요. 디렉토리를 대상으로 한 경우는 디렉토리의 서브 디렉토리내의 이미지도 포함해 처리를 실행. -f ,
--format
 : 출력 형식의 파일 형식을 지정 . 출력처의 디렉토리명을 지정. 존재하지 않는 경우는 신규로 작성 됩니다 . 를 지정합니다. gpu 를 사용할 수 없는 경우는 cpu 로 추론이 실행 . 이미지의 개행 위치를 무시하고, 단락내의 ​​문장을 연결해 돌려 준다 . 내보내기 .--- figure : 감지 된 그림, 이미지를 출력 파일로 내보내기 (html 및 markdown 전용)

 

 

" results" 폴더 아래에 세 개의 파일이 출력됩니다.

 

 

· _sample_p1_layout.jpg

 

 

 

・sample_p1_ocr.jpg

 

 

· _sample_p1.md

あう〜

ファイルサイズ<br>ぜんぜん小さく<br>ならないよ

どうしよう<br>i坊

ファイルサイズ<br>小さくするには<br>コツがあるからな

クラスや<br>メソッドの数を<br>少なくしたり

1つの変数を<br>使い回したり

プリプロセッサ<br>を使ったり

逆アセンブル<br>して無駄ないか<br>チェックしたり

さすがi坊<br>その方法で<br>小さくして<br>おいてね

300K

 

 

한국어 번역

아~

파일 크기 <br> 전혀 작지 않습니다.

어떻게하자<br>i보

파일 크기 <br>작게 만들려면 요령이 있기 때문에

클래스 및 <br>메소드의 수를 줄이거나

하나의 변수를 사용하여 돌리거나

전처리기<br>를 사용하거나

디스어셈블리하고 낭비하지 않는지 확인하십시오.

과연 ibo <br>그런 식으로 작게 만들어주세요.

300K

 

 

 

(추가 내용)
다음단계는
원 일본 글자 위치에 한국 번역글을 치환하여 변형 가능하게끔 할 수 있는 방법이 있을지
계속 찾아 봐야 겠네요 ^^ 

 

 

 

 

Q1) Grounding with Google Search와 검색 엔진 최적화(SEO) 관계는 ?

 

 

"Google Search로 그라운딩"과 검색 엔진 최적화(SEO)는 서로 밀접한 관련이 있습니다.[1][2][3]

 

"Google Search로 그라운딩"은 AI 모델이 생성한 답변을 실제 웹 정보에 연결하는 기능입니다.[1][2][3]
이는 AI 모델이 제공하는 정보의 신뢰성을 높이고, 사용자는 추가 정보를 쉽게 확인할 수 있도록 합니다.[
2][3]

 

SEO는 웹사이트가 검색 엔진에서 높은 순위에 노출될 수 있도록 최적화하는 과정입니다.[2][3][4]

 

이 두 가지는 다음과 같은 관계를 가지고 있습니다.

  • SEO는 "Google Search로 그라운딩"의 기반이 됩니다. SEO를 통해 웹사이트가 검색 엔진에서 높은 순위를 차지하면, Google Search는 해당 웹사이트의 정보를 더 많이 수집하고, "Google Search로 그라운딩" 기능을 통해 AI 모델이 해당 웹사이트 정보를 활용할 가능성이 높아집니다.[1][2][3]
  • "Google Search로 그라운딩"은 SEO에 도움이 될 수 있습니다. AI 모델이 "Google Search로 그라운딩" 기능을 통해 웹 정보를 사용하여 답변을 생성하면, 해당 웹사이트의 가시성이 높아지고, 사용자 트래픽이 증가할 수 있습니다.[1][3]

결론적으로, "Google Search로 그라운딩"은 SEO의 발전된 형태라고 볼 수 있습니다.[1][2][3] SEO를 통해 웹사이트가 검색 엔진에서 높은 순위를 차지하고, "Google Search로 그라운딩" 기능을 통해 AI 모델이 해당 웹사이트 정보를 활용하여 더욱 정확하고 신뢰성 있는 정보를 제공함으로써, 사용자 경험을 향상시키는 선순환 구조를 만들 수 있습니다.[3]

Grounding Sources help
  1. upsecretseo.com
  2. inblog.ai
  3. wix.com
  4. google.com

 

Q2) 그러면 나의 블로그 사이트를 SEO에 적합화 하여 순위를 높이려면 어떤 수정작업을 하면 좋은 SEO 결과를 얻을 수 있습니까 ?

 

 

블로그 사이트의 SEO를 개선하여 순위를 높이려면 다음과 같은 수정 작업을 시도해 볼 수 있습니다.

1. 키워드 연구 및 활용

  • 타겟 키워드 파악: 블로그 주제와 관련된, 사람들이 실제로 검색하는 키워드를 찾아 목록을 만듭니다.[1]
  • 키워드 난이도 분석: 경쟁이 심한 키워드는 순위를 올리기 어려울 수 있습니다.[1] 적절한 난이도의 키워드를 선택합니다.
  • 키워드 자연스럽게 활용: 키워드를 제목, 부제목, 본문, 이미지 alt 태그, 메타 설명에 자연스럽게 배치합니다.[1] 키워드 밀집도가 너무 높으면 오히려 불이익을 받을 수 있으므로 주의하세요.
  • 롱테일 키워드 활용: 긴 키워드(예: "서울 강남 맛집 추천")는 경쟁이 덜하고, 특정 사용자를 타겟팅하기 좋습니다.

2. 콘텐츠 최적화

  • 고품질 콘텐츠 제작: 유익하고 독창적인 콘텐츠를 제공하여 사용자의 관심을 유지합니다.[1]
  • 콘텐츠 길이: 긴 콘텐츠(1,000 단어 이상)는 구글에서 더 높은 순위를 부여받는 경향이 있습니다.[1]
  • 내용 구조화: 제목, 부제목, 목록, 이미지를 사용하여 콘텐츠를 읽기 쉽게 구성합니다.
  • 주제별 카테고리 분류: 블로그 게시글을 주제별로 카테고리화하여 사용자의 접근성을 높입니다.[1]

3. 기술적 SEO 최적화

  • 모바일 친화성: 모바일 기기에서도 잘 보이는 반응형 웹 디자인을 사용합니다.[1]
  • 페이지 속도: 웹 페이지 로딩 속도를 개선합니다.[1] 이미지 최적화, 캐싱, 압축 등을 활용할 수 있습니다.[1]
  • 사이트맵 제출: 사이트맵을 만들어 구글에 제출하여 검색 엔진이 블로그 콘텐츠를 더 쉽게 인덱싱하도록 돕습니다.[1]
  • URL 구조: 키워드를 포함하고 이해하기 쉬운 URL 구조를 사용합니다.[1]
  • HTTPS 프로토콜: 보안을 위해 HTTPS 프로토콜을 사용합니다.[1]

4. 외부 링크 구축

  • 고품질 백링크 확보: 다른 웹사이트에서 블로그로 연결되는 링크를 확보합니다.[1]
  • 게스트 포스팅: 다른 블로그에 글을 작성하여 블로그로 연결되는 링크를 얻습니다.[1]
  • 소셜 미디어 공유: 소셜 미디어에 블로그 게시글을 공유하여 트래픽을 유도하고 외부 링크를 확보합니다.[1]

5. 분석 및 개선

  • 구글 애널리틱스 활용: 블로그 방문자 수, 페이지 조회 수, 튕겨 나가기율 등을 분석하여 개선점을 찾습니다.
  • 검색 콘솔 활용: 블로그가 검색 엔진에서 어떻게 인덱싱 되는지 확인하고 오류를 해결합니다.[1]
  • 경쟁사 분석: 경쟁 블로그 사이트를 분석하여 SEO 전략을 개선합니다.[1]

추가 정보:

  • SEO는 장기적인 작업입니다.[1] 빠른 효과를 기대하기보다는 꾸준히 노력하는 것이 중요합니다.
  • 최신 SEO 트렌드를 지속적으로 학습하고 적용해야 합니다.[1]
  • 위에서 언급한 모든 요소들을 종합적으로 고려하여 블로그 사이트를 최적화해야 좋은 결과를 얻을 수 있습니다.
Grounding Sources help
  1. flipbuilder.com

 
 

Q3) 그러면 "USB-C 미래 시장동향 분석 및 아이디어" 라는 제목으로 블로그 글을 SEO에 최적화 해서 만들어 주세요

 

USB-C, 미래를 잇는 연결의 혁명: 시장 동향 분석과 놓치지 말아야 할 기회들[1][2]

2024년 11월 2일 기준[1]

 

서론: USB-C, 변화의 중심에 서다[2][3]

 

스마트폰, 노트북, 태블릿...[1][2][3][4]
우리 주변의 디지털 기기들은 점점 더 USB-C 포트를 채택하고 있습니다.[
1][2]
단순한 연결 방식을 넘어 빠른 데이터 전송, 양방향 연결, 고출력 충전 등 다양한 기능을 제공하며 USB-C는 디지털 시대의 핵심 연결 기술로 자리매김했습니다.[
1][2]
이제 USB-C는 단순한 기술을 넘어 미래 시장의 성장을 견인하는 핵심 동력으로 떠올랐습니다.[
1][2][3]

 

1. USB-C 시장, 폭발적인 성장세를 이어가다[2][3][5]

 

USB-C 시장은 2023년 364억 달러 규모에서 2031년 657억 5천만 달러로 성장할 것으로 예상됩니다.[2][3]
이는 연평균 16.37%의 높은 성장률을 의미하며, USB-C가 미래 기술 시장에서 차지하는 비중이 얼마나 큰지 보여줍니다.[
2]

 

1.1. USB-C 시장 성장을 이끄는 핵심 동력[2][3]

  • 데이터 전송 속도 향상에 대한 요구 증가: 고화질 영상, 대용량 파일 전송 등 데이터 처리량이 증가하면서 더 빠른 데이터 전송 속도를 지원하는 USB-C에 대한 수요가 급증하고 있습니다.[1][2][3]
  • 고속 충전 기능의 중요성 부각: 스마트폰, 노트북 등 전자 기기의 배터리 용량이 커지면서 빠르게 충전할 수 있는 고속 충전 기능에 대한 요구가 높아지고 있습니다.[1][3] USB-C는 고속 충전 기술을 지원하며 사용자의 편의성을 높이는 데 중요한 역할을 합니다.[1][2]
  • 다양한 기기의 USB-C 포트 채택 확대: 스마트폰, 노트북, 태블릿 뿐만 아니라 디지털 카메라, 게임 콘솔, 외장 하드 드라이브 등 다양한 전자 기기에서 USB-C 포트를 채택하고 있습니다.[1][3] 이는 USB-C의 범용성을 확대하고 시장 성장을 촉진하는 주요 요인입니다.[1]

1.2. USB-C 시장, 주목할 만한 핵심 트렌드[2]

  • USB-C 충전 케이블 시장, 지속적인 성장: USB-C 충전 케이블 시장은 2028년까지 연평균 16.0% 성장할 것으로 예상됩니다.[2][3] 이는 스마트폰, 노트북 등 USB-C 포트를 사용하는 전자 기기의 증가와 더 빠른 충전 속도를 지원하는 고성능 충전 케이블에 대한 수요가 증가하고 있기 때문입니다.[1][4]
  • 기술 융합과 다기능화: USB-C는 Thunderbolt, DisplayPort, HDMI 등 다른 인터페이스 기술과의 융합을 통해 데이터 전송, 영상 출력, 고속 충전 등 다양한 기능을 하나의 포트에서 구현할 수 있게 되었습니다.[1][2][3]
  • 내구성과 수명에 대한 소비자 기대치 상승: 소비자들은 더욱 튼튼하고 오래 사용할 수 있는 USB-C 케이블과 충전기를 요구하고 있습니다.[1][3] 이러한 요구는 USB-C 시장에서 고품질 제품에 대한 수요를 증가시키고 있습니다.[1][2]

2. USB-C 미래 전망: 더욱 넓어지는 활용 영역과 새로운 가능성[2][3]

  • 다양한 분야로의 확장: USB-C는 스마트폰, 노트북 등 개인용 전자 기기에서 벗어나 자동차, 가전제품, 산업 장비 등 다양한 분야로 활용 영역을 확대하고 있습니다.[1][3]
    특히 자동차 분야에서는 USB-C를 통해 차량 내 정보 시스템, 주행 보조 시스템, 엔터테인먼트 시스템 등을 연결하고 제어할 수 있습니다.[
    1][2][3]
  • 무선 충전 기술과의 공존과 경쟁: USB-C는 무선 충전 기술과 공존하면서 경쟁을 펼치고 있습니다.[1][2][3] 무선 충전은 편리성을 강조하지만, USB-C는 고속 충전, 데이터 전송 등 다양한 기능을 제공하며 장점을 보유하고 있습니다.[1][2] 향후 두 기술은 각자의 장점을 살려 시장을 공유하며 발전할 것으로 예상됩니다.[2]

3. USB-C, 미래 시장을 선도하는 핵심 아이디어[1][2]

  • 고속 충전 기술 개발: 더 빠르고 효율적인 충전 기술 개발에 집중해야 합니다.[1][2]
    특히 USB Power Delivery (PD) 표준을 활용한 고출력 충전 기술 개발은 USB-C 시장을 선도하는 핵심 경쟁력이 될 것입니다.[
    1]
  • 다기능 USB-C 케이블 개발: 데이터 전송, 충전, 영상 출력 등 다양한 기능을 하나의 케이블에서 구현하는 다기능 USB-C 케이블 개발은 소비자의 편의성을 높이고 시장 경쟁력을 강화할 것입니다.[1][2][3]
  • USB-C 기반 액세서리 시장 확대: USB-C 포트를 활용한 허브, 어댑터, 케이블 등 다양한 액세서리 개발을 통해 새로운 시장 기회를 창출할 수 있습니다.[1][2][3]
  • 차세대 USB-C 표준 개발: 더욱 빠르고 안전하며 효율적인 차세대 USB-C 표준 개발은 미래 시장을 주도하는 핵심 요소가 될 것입니다.[1][2] 차세대 USB-C 표준은 더 높은 데이터 전송 속도, 더 강력한 전력 출력, 더 높은 안정성을 제공할 것으로 기대됩니다.[1][2]

4. USB-C, 미래를 향한 혁신의 핵심[2][3]

USB-C는 더 빠르고 편리하며 안전한 디지털 연결을 위해 끊임없이 진화하고 있습니다.[1][2] 기업들은 USB-C 기술을 활용한 혁신적인 제품과 서비스를 개발하고 시장 경쟁력을 강화해야 합니다.[1][2] USB-C는 단순한 연결 방식을 넘어 미래 디지털 시대를 이끌어갈 핵심 기술로 자리매김할 것입니다.[2]

 

SEO 최적화:

  • 키워드: USB-C, 미래 시장, 시장 동향, 아이디어, 혁신, 기술, 충전, 데이터 전송, 액세서리, 표준, USB Power Delivery (PD), Thunderbolt, DisplayPort, HDMI, 무선 충전, 자동차, 가전제품, 산업 장비[1][2][3]
  • 제목: USB-C, 미래를 잇는 연결의 혁명: 시장 동향 분석과 놓치지 말아야 할 기회들[1][2][3]
  • 본문: 키워드를 자연스럽게 활용하고, 내용을 명확하고 간결하게 구성했습니다. 또한 각 항목에 부제목을 사용하여 가독성을 높였습니다.[1]
  • 외부 링크: 참고 자료 출처 링크를 추가했습니다.
  • 이미지: USB-C 관련 이미지를 추가하면 더욱 효과적입니다.[1][2]

참고 자료:

  • [1] 알쏭달쏭한 USB C타입 충전기의 세계 파헤치기 - 네이버 블로그[1][2][3]
  • [2] USB 타입 C 시장 규모, 동향 및 전망 - Market Research Intellect[1][2][3][5]
  • [3] 자동차용 USB-C 시장규모 | 성장 분석 2036 - Research Nester[2]
  • [4] 글로벌 USB-C 충전 케이블 시장 규모, 동향 및 전망 - Market Research Intellect[2][5]
  • [5] USB Type-C 시장 통계 동향 및 예측 2036[4]

추가 정보:

  • 블로그 글에 SEO 요소를 추가하여 검색 엔진 최적화를 돕는 것이 중요합니다.[2][3]
  • 블로그 글 작성 시 핵심 키워드를 제목, 부제목, 본문, 이미지 alt 태그 등에 자연스럽게 활용해야 합니다.[2][3]
  • SEO는 장기적인 작업이므로 꾸준히 노력해야 좋은 결과를 얻을 수 있습니다.[2][3]
 

 

 


Q4) 위 블로그에서 SEO에 적합한 해세태그를 알려 주세요

 

 

블로그 게시글에 적합한 해시태그를 알려드릴게요!

일반적인 해시태그:

  • #USBC
  • #USBTypeC
  • #기술
  • #혁신
  • #미래기술
  • #연결성[1]
  • #시장동향[1]
  • #시장분석[1]
  • #기술트렌드
  • #기술뉴스
  • #기술업데이트

특정 해시태그:

  • #고속충전[1]
  • #빠른충전[1]
  • #전력전달[1]
  • #USBPD[1]
  • #무선충전[1]
  • #데이터전송[1]
  • #범용연결성
  • #기기호환성
  • #IoT[1]
  • #5G
  • #데이터중심사회[1]
  • #액세서리
  • #허브
  • #어댑터
  • #케이블

해시태그 사용 팁:

  • 일반적인 해시태그와 특정 해시태그를 섞어 사용하세요. 이렇게 하면 더 많은 사람들에게 게시글이 노출될 수 있습니다.[1]
  • 과도하게 사용하지 마세요. 몇 개의 적절한 해시태그가 긴 목록의 무관한 해시태그보다 더 효과적입니다.
  • 해당 분야에서 인기 있는 해시태그를 조사하세요. 다른 사람들이 어떤 해시태그를 사용하는지 확인하고 가장 관련성이 높은 해시태그를 포함하세요.
  • 블로그 게시글과 관련된 해시태그를 사용하세요. 인기 있는 해시태그만 사용하는 대신 게시글 주제를 정확하게 반영하는 해시태그를 선택하세요.[1]

관련 해시태그를 사용하면 블로그 게시글의 가시성을 높이고 더 많은 사람들에게 도달할 수 있습니다.

 


USB-C: The Future of Connectivity - Market Trends, Opportunities, and Ideas

As of November 2, 2024

 

Introduction: Riding the Wave of Innovation, USB-C Shapes the Future

Smartphones, laptops, tablets...[1][2] almost every device in our hands is now connected through a small port called USB-C. USB-C goes beyond a simple connection method; it offers high-speed data transfer, bi-directional connectivity, and powerful charging capabilities, overcoming the limitations of previous USB ports and becoming a cornerstone of future technological advancements.

 

1. Explosive Growth and Key Drivers: The Remarkable Ascent of the USB-C Market

 

The USB-C market is projected to skyrocket from $36.4 billion in 2023 to $65.75 billion in 2031, exhibiting an explosive growth rate of 16.37% annually. This growth is driven by several key factors:

  • Faster Speeds, More Powerful Charging: Consumers demand faster data transfer speeds and high-speed charging. With increasing smartphone and laptop usage, rapid charging has become essential, and USB-C is the key technology meeting this demand.
  • Complete Device Integration: USB-C adoption is expanding across various electronic devices, from smartphones and laptops to tablets, creating a convenient single-port solution for connecting all devices. This removes the hassle of managing complex cables and improves portability for users.
  • Expansion into New Possibilities: The application of USB-C is expanding into diverse fields like automobiles, household appliances, and industrial equipment, further increasing market size. As technologies like autonomous vehicles, smart homes, and industrial automation systems progress, the scope of USB-C applications is expected to widen even further.

2. Key Trends in the USB-C Market: Evolving Technology and Markets

 

Beyond simple growth, the USB-C market is advancing through several key trends:

  • Advancements in High-Speed Charging Technology: Faster and more efficient USB-C charging technology is continuously evolving, with a projected 16% annual growth rate through 2028. The development of USB Power Delivery (PD) technology enables high-power charging, facilitating faster charging for devices like laptops and tablets with high power consumption.
  • Enhanced Multifunctionality and Compatibility: USB-C integrates with other interface technologies such as Thunderbolt, DisplayPort, and HDMI, offering greater versatility and improved universal compatibility. This allows users to utilize a single USB-C port for diverse functionalities like data transfer, charging, and video output with ease.[2]
  • Intense Competition with Wireless Charging Technology: USB-C competes with wireless charging technologies, constantly evolving to offer more convenient and efficient charging solutions. Wireless charging technology offers convenience but lags behind USB-C in terms of charging speed and efficiency. Through advancements in technology, USB-C aims to dominate the market and strengthen its position.

3. Ideas to Seize Opportunities in the USB-C Market

  • Lead in High-Speed Charging Technology: Focus on developing USB-C charging technology that delivers even faster charging speeds. Invest in innovative charging technologies that transcend existing limitations, such as high-power charging, integration with wireless charging technologies, and enhancements to charging efficiency, to secure a competitive edge in the market.
  • Develop Multifunctional USB-C Cables: Develop USB-C cables that offer a range of functionalities like data transfer, charging, and video output, maximizing user convenience. Prioritize developing cables with thin and lightweight designs, enhanced durability, and broad device compatibility to meet the needs of consumers.
  • Venture into the USB-C Based Accessory Market: Developing various accessories (e.g., hubs, adapters, cables) that utilize USB-C ports presents a new market entry opportunity. Accurately understand consumer needs and develop diverse accessories to capture market share. Focus on developing high-quality products with a good price-performance ratio and varied designs to meet consumer demands.
  • Secure the Next Generation of USB-C Standards: Develop a faster, safer, and more efficient next-generation USB-C standard to lead the future market. Leading the development of next-generation USB-C standards that anticipate future technology trends will strengthen market dominance. Prioritize advancements in data transfer speeds, power efficiency, and security to prepare for future technological advancements.

4. Future Prospects for the USB-C Market: Towards Boundless Possibilities

USB-C will play a pivotal role in all areas, from smartphones, laptops, and tablets to automobiles, household appliances, and industrial equipment, driving future technological advancements.

  • Core of the IoT Era: USB-C enables the connection of various smart devices, driving the growth of the IoT era.
  • Essential Element of the 5G Era: USB-C supports high-speed data transfer, playing a crucial role in realizing the fast internet environment of the 5G era.
  • Foundation for a Data-Centric Society: USB-C supports large-scale data transfer, accelerating the development of a data-centric society.

Conclusion: USB-C: At the Heart of Innovation Connecting the Future

USB-C will continuously evolve with technological advancements, opening up new possibilities. By developing innovative products and services using USB-C technology, companies can lead the future market and achieve growth in a changing world.

 

 

SEO Optimization:

  • Keywords: USB-C, future market, market trends, ideas, innovation, technology, charging, data transfer, accessories, standards, growth, prospects, trends, opportunities, competition, leadership, development, IoT, 5G, data-centric society, USB Power Delivery, Thunderbolt, DisplayPort, HDMI
  • Title: USB-C: The Future of Connectivity - Market Trends, Opportunities, and Ideas
  • Body: Keywords are naturally integrated, and the content is organized clearly and systematically. Notably, keywords are distributed evenly across the title, subtitles, and body text.
  • External Links: Links to sources have been added.
  • Images: Adding relevant images enhances the impact. Use high-quality images and incorporate keywords in the image alt text to optimize for search engines.

References:

  • [1] The Future of USB-C Monitor Technology - ViewSonic Library (2024-05-31)
  • [2] USB Type C Market Trends & Growth Highlights 2024-2034 - Future Market Insights (2024-04-24)
  • [3] USB Type-C socket: The future of data and power transmission - Asa Plastici (2024-06-20)
  • [4] It's 2024 and USB-C is even more of a mess - Android Authority (2024-05-21)

Additional Information:

  • Incorporating SEO elements into blog posts is crucial for search engine optimization.
  • Naturally utilize keywords in the title, subtitles, body text, and image alt text.
  • SEO is a long-term endeavor, requiring consistent efforts to achieve positive results.
  • Utilize relevant keywords, but avoid excessive keyword density.
  • Create original and informative content to attract user interest.
  • Regularly update your blog with fresh content and engage with your audience.
Grounding Sources help
  1. asaplastici.com
  2. futuremarketinsights.com
 

 

 

 

· Introducing the Realtime API

 

1. Realtime API

오늘(2024년 10월 1일), OpenAI로부터 「Realtime API」가 발표되었습니다. 이를 통해 개발자는 앱에서 저지연 멀티모달 대화 환경을 구축 할 수 있습니다. ChatGPT의 'Advanced Voice Mode'와 마찬가지로 6가지 프리셋 오디오를 사용하여 자연스러운 speech-to-speech를 지원합니다.

 

또한 " Chat Completions API " 의 오디오 입출력이 발표되었습니다. 이것은 "Realtime API"의 낮은 지연 이점을 필요로 하지 않는 유스 케이스를 지원합니다. 개발자는 모든 텍스트 오디오를 "GPT-4o"에 전달하고 텍스트 오디오를 모두 선택하고 응답 할 수 있습니다.

2. Realtime API의 작동 방식

지금까지 음성 어시스턴트를 실현하기 위해서는, 음성 인식 모델로 음성을 써내, 그 텍스트를 텍스트 모델에 건네주어 추론을 실시해, 그 출력을 텍스트 독해 기능으로 재생할 필요가 있었습니다. 이 접근법에서는 감정, 강조, 악센트가 손실되어 지연이 현저해질 수 있습니다 .

 

Chat Completions API 를 사용하면 개발자는 한 번의 API 호출로 전체 프로세스를 처리할 수 있지만 사람의 대화보다 느립니다. Realtime API는 오디오 입출력을 직접 스트리밍하여 이를 개선하여 보다 자연스러운 대화 경험을 제공합니다. 또한 ChatGPT의 'Advanced Voice Mode'와 마찬가지로 중단을 자동으로 처리 할 수 있습니다.

 

내부적으로는, 「Realtime API」에서는 「GPT-4o」라고 메세지를 교환하기 위한 영속적인 「WebSocket」를 작성합니다. 이 API는 Function Calling 도 지원합니다. 이렇게 하면 음성 도우미가 작업을 트리거하거나 새 컨텍스트를 검색하여 사용자의 요청에 응답할 수 있습니다.

3. Realtime API 사용 요금

" Realtime API "는 " gpt-4o-realtime-preview ", " Chat Completions API "는 " gpt-4o-audio-preview "로 향후 몇 주 내에 출시됩니다.

Realtime API는 텍스트 토큰과 오디오 토큰을 모두 사용합니다. 텍스트 입력 가격은 100만 토큰당 5달러, 출력 가격은 100만 토큰당 20달러입니다. 오디오 입력 가격은 100만 토큰당 100달러이고 출력 가격은 100만 토큰당 200달러입니다. 이는 오디오 입력 분당 약 0.06달러, 오디오 출력 분당 약 0.24달러에 해당합니다 . 'Chat Completions API'의 오디오도 같은 가격이 됩니다.

4. 안전과 프라이버시

Realtime API는 자동 모니터링 및 신고된 모델의 입/출력에 대한 인간 검토 등 여러 안전 보호 계층을 사용하여 API 무단 사용의 위험을 줄입니다. ChatGPT의 고급 음성 모드를 실행하는 GPT-4o와 동일한 버전으로 구축되었으며 GPT-4o 시스템 카드 에 자세히 설명 된 " Preparedness Framework "에 따른 평가를 포함한 자동 평가 및 인간 평가 둘 다를 사용하여 신중하게 평가했습니다. 고급 음성 모드를 위해 구축된 것과 동일한 오디오 안전 인프라도 활용되고 있으며, 이 테스트는 이것이 위험의 가능성을 줄이는 데 도움이 된다는 것을 보여줍니다.

OpenAI 서비스의 출력을 스팸, 오해를 초래하거나 타인에게 해를 끼칠 목적으로 재사용 또는 배포하는 것은 이용 정책을 위반합니다. 당사는 잠재적인 무단 사용을 적극적으로 모니터링합니다. 컨텍스트에서 명백한 경우를 제외하고 개발자가 AI와 상호 작용하고 있음을 사용자에게 명확하게 전달해야합니다.

출시 전에 외부 레드 팀 네트워크에서 'Realtime API'를 테스트한 결과, 'Realtime API'는 기존 완화 방법으로 다루지 않은 고위험 갭이 발생하지 않음을 확인했습니다. 모든 API 서비스와 마찬가지로 "Realtime API"는 OpenAI의 엔터프라이즈 개인 정보 보호 약속의 대상이됩니다. OpenAI는 명시적인 권한 없이 이 서비스에서 사용되는 입력 또는 출력으로 모델을 학습하지 않습니다.

5. Realtime API 시작

향후 며칠 이내에 개발자는 Playground 또는 문서, 참조 클라이언트에서 Realtime API  시작할 수 있습니다 .

또한 LiveKit 및 Agora 와 협력하여 에코 제거기, 재연결 및 방음과 같은 오디오 구성 요소의 클라이언트 라이브러리를 만들고 Twilio 와 협력하여 Realtime API를 Twilio Voice API 와 통합하여 개발자가 음성 통화를 통해 AI 가상 에이전트를 원활하게 구축, 배포, 고객과 연결할 수 있도록 했습니다.

6. 향후 전개

향후 도입을 예정하고 있는 기능은 다음과 같습니다.

 

・더 많은 모달리티
「Realtime API」는, 처음에 음성을 서포트해, 시간 경과와 함께 Vision 나 Video 등의 모달리티를 추가 서포트할 예정입니다.

·속도 제한 인상 현재 API 속도 제한은  Tier 5 개발자의 경우 약 100 동시 세션으로 제한되어 있으며  Tier 1 ~ 4의 경우 제한이 낮습니다. 앞으로 이러한 한계를 서서히 끌어올 것입니다.

・공식 SDK 지원
「Realtime API」의 서포트를 「OpenAI Python」 및 「Node.js SDK」에 통합합니다.

· 프롬프트 캐시
Prompt Caching "에 대한 지원을 추가합니다. 이전 대화 턴을 할인 가격으로 재처리할 수 있습니다.

・모델 지원
「Realtime API」는 「GPT-4o mini」도 향후 서포트합니다.

 

https://note.com/npaka/n/n7317484e15e1



 

-----

OpenAI 실시간 API의 핵심 기능과 장점은 무엇이며, 어떤 방식으로 활용될 수 있을까?

 

OpenAI 실시간 API의 핵심 기능, 장점 및 활용 방식

OpenAI 실시간 API는 애플리케이션에 저지연 멀티모달 대화 경험을 구축할 수 있도록 고안된 API입니다.[1,2] 기존 음성 비서 구축 방식은 음성 인식, 텍스트 기반 모델 추론, 텍스트 음성 변환과 같은 여러 단계를 거치면서 감정 전달이 부족하고 지연 시간이 길어지는 단점이 있었습니다.[2] 하지만 실시간 API는 오디오 입출력을 직접 스트리밍하여 보다 자연스러운 대화 경험을 제공하며 ChatGPT의 고급 음성 모드와 마찬가지로 대화 중단을 자동으로 처리합니다.[3]
 

주요 기능:

  • WebSocket을 통한 실시간 스트리밍: 실시간 API는 WebSocket을 통해 서버와 지속적인 연결을 유지하여 오디오 및 텍스트 데이터를 실시간으로 주고받습니다.[1,3] 이는 짧은 지연 시간과 자연스러운 대화 흐름을 가능하게 합니다.
  • 음성 합성 및 인식: 실시간 API는 텍스트를 자연스러운 음성으로 변환하는 TTS(Text-to-Speech)와 음성을 텍스트로 변환하는 STT(Speech-to-Text) 기능을 모두 지원합니다.[1,2] 풍부한 뉘앙스를 가진 고품질의 음성 합성을 제공하며, 자연스러운 억양과 감정 표현이 가능합니다.
  • 멀티모달 출력: 텍스트와 음성을 동시에 출력할 수 있습니다.1 텍스트는 콘텐츠 조정에 활용되고, 오디오는 안정적인 재생을 보장합니다.
  • 상태 유지: 실시간 API는 WebSocket 연결 중에 세션 정보, 대화 기록, 입력 오디오 버퍼, 응답, 함수 호출 등의 상태 정보를 유지합니다.[4] 이를 통해 대화의 맥락을 유지하고 일관성 있는 응답을 제공할 수 있습니다.
  • 함수 호출: 실시간 API는 함수 호출 기능을 지원하여 외부 시스템과의 연동을 가능하게 합니다.[1,5,6,7] 날씨 정보를 가져오거나 일정을 예약하는 등의 작업을 수행할 수 있습니다.
  • 다양한 이벤트 처리: 실시간 API는 다양한 이벤트를 통해 서버와 클라이언트 간의 통신을 지원합니다.[7,8] 세션 생성, 업데이트, 오디오 입력, 응답 생성, 오류 처리 등의 이벤트를 처리할 수 있습니다.

장점:

  • 자연스러운 대화: 실시간 스트리밍을 통해 기존 방식보다 훨씬 자연스러운 대화 흐름을 제공합니다.
  • 낮은 지연 시간: 실시간 오디오 처리를 통해 딜레이를 최소화하여 실시간에 가까운 대화 경험을 제공합니다.
  • 멀티모달 경험: 텍스트와 음성을 동시에 사용하여 더욱 풍부하고 몰입감 있는 사용자 경험을 제공할 수 있습니다.
  • 유연한 통합: WebSocket과 다양한 이벤트를 지원하여 다양한 애플리케이션에 유연한 통합.
  • 향상된 정확성: 오디오 입력을 직접 처리하여 기존 방식의 음성-텍스트 변환 오류를 줄일 수 있습니다.
 

활용 방식:

  • 실시간 음성 비서: 실시간 API를 활용하여 ChatGPT의 고급 음성 모드와 유사한 수준의 자연스러운 대화가 가능한 음성 비서를 개발할 수 있습니다.[2,3] AI 기반 챗봇: 텍스트 기반 챗봇에 실시간 음성 인터페이스를 추가하여 사용자 편의성을 높일 수 있습니다.
  • 게임 및 VR/AR 콘텐츠: 실시간 음성 상호 작용을 통해 게임 캐릭터와 소통하거나 VR/AR 환경에서 몰입감 있는 경험을 제공할 수 있습니다.
  • 온라인 교육 플랫폼: 실시간 음성 질의응답, 피드백 제공 등을 통해 학습 효과를 높일 수 있습니다.

 

기타 고려 사항:

  • 오디오 형식: 현재 실시간 API는 24kHz, 1채널, 리틀 엔디안 방식의 Raw 16비트 PCM 오디오와 8kHz G.711 (u-law 및 a-law) 형식을 지원합니다.[9]
  • 안전 및 보안: OpenAI는 API 오용 방지를 위해 자동 모니터링, 플래그 모델, 사람의 검토 등 여러 보안 레이어를 사용합니다.[10]
  • 요금: 실시간 API는 텍스트 토큰과 오디오 토큰을 모두 사용하며, 오디오 입력은 1분당 약 0.06달러, 오디오 출력은 1분당 약 0.24달러입니다.[3]

OpenAI 실시간 API는 아직 개발 초기 단계이지만, 자연스러운 음성 인터페이스를 갖춘 다양한 애플리케이션 개발을 가능하게 하는 강력한 도구입니다. 앞으로 더 많은 기능과 향상된 성능이 제공될 예정입니다.

 
 

 

DOWNLOAD THE CONVERTED WEIGHTS

Some generous anon converted all the weights. Grab them here: https://rentry.org/LLaMA-8GB-Edition and https://rentry.org/llama-tard-v2

Huggingface implementation is available now!

gh pr checkout 21955 inside the transformers directory. You'll need to clone it first: git clone https://github.com/huggingface/transformers

llamanon here.
This guide is supposed to be understandable to the average /aicg/ user (possibly retarded). This is for Linux obviously - I don't know how to run bitsandbytes on Windows, and I don't have a Windows machine to test it on.

If you're on Windows, I recommend using Oobabooga. It now supports LLaMA with 8bit.

Why don't I recommend using oobabooga? It's terrible at memory management and according to my tests, you'll use less VRAM with meta's own inference code as opposed to ooba's.

여기 라마논.
이 가이드는 평균 /aicg/ 사용자(지체 가능성이 있음)가 이해할 수 있도록 되어 있습니다.이것은 Linux용입니다.Windows에서 비트나 바이트를 실행하는 방법을 모르기 때문에 테스트할 수 있는 Windows 머신이 없습니다.

Windows  사용하고 있는 경우는, Oobobooga 를 사용하는 것을 추천합니다.8비트로 LLaMA를 지원하게 되었습니다.

OOBabooga를 추천하는 것은 어떨까요?메모리 관리 능력이 형편없고, 제 테스트에 따르면, oba가 아닌 메타의 자체 추론 코드로 VRAM을 덜 사용하게 될 것입니다.





Download LLaMA weights

magnet:?xt=urn:btih:b8287ebfa04f879b048d4d4404108cf3e8014352&dn=LLaMA&tr=udp%3a%2f%2ftracker.opentrackr.org%3a1337%2fannounce
Get the .torrent

Please download and seed all the model weights if you can. If you want to run a single model, don't forget to download the tokenizer.model file too.

Set up Conda and create an environment for LLaMA

I hate conda too, but it's the official method recommended by meta for some reason, and I don't want to deviate.
저도 콘다는 싫지만 메타가 추천하는 공식 방법이라서 벗어나고 싶지 않아요.

Set up Conda

  1. Open a terminal and run: 
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh


2. Run

chmod +x Miniconda3-latest-Linux-x86_64.sh


3. Run 

./Miniconda3-latest-Linux-x86_64.sh

 

4. Go with the default options. When it shows you the license, hit q to continue the installation.
기본 옵션을 사용합니다.라이선스가 표시되면q설치를 계속합니다.

 

5. Refresh your shell by logging out and logging in back again.
로그아웃한 후 다시 로그인하여 셸을 새로 고칩니다
I think closing the terminal works too, but I don't remember. Try both.
터미널을 닫으면 되는 것 같은데 기억이 안 나네요.둘 다 먹어봐.

 

Create env and install dependencies (환경 및 설치 의존 관계 생성)

  1. Create an env: 환경을 만듭니다.
    conda create -n llama
  2. Activate the env: env를 활성화합니다.
    conda activate llama
  3. Install the dependencies:의존 관계를 인스톨 합니다.
    NVIDIA:
    conda install torchvision torchaudio pytorch-cuda=11.7 git -c pytorch -c nvidia
    AMD:
    pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/rocm5.2
  4. Clone the INT8 repo by tloen: INT8 repo를 tloen으로 복제합니다.
    git clone https://github.com/tloen/llama-int8 && cd llama-int8
  5. Install the requirements: 요건을 인스톨 합니다.
    pip install -r requirements.txt pip install -e .

Create a swapfile 스왑 파일 생성

Loading the weights for 13B and higher models needs considerable amount of DRAM. IIRC it takes about 50GB for 13B, and over a 100GB for 30B. You'll need a swapfile to take care of excess memory usage. This is only used for the loading process; inference is unaffected (as long as you meet the VRAM requirements). 
13B 이상 모델의 무게를 로드하려면 상당한 양의 DRAM이 필요합니다.IIRC는 13B의 경우 약 50GB, 30B의 경우 100GB 이상이 소요됩니다.과도한 메모리 사용량을 처리하려면 스왑 파일이 필요합니다.이것은 로드 프로세스에만 사용됩니다.추론은 영향을 받지 않습니다(VRAM 요건을 충족하는 한).

  1. Create a swapfile: 스왑 파일 생성:
    sudo dd if=/dev/zero of=/swapfile bs=4M count=13000 status=progressThis will create about ~50GB swapfile. Edit the count to your preference. 13000 means 4MBx13000.
    그러면 약 50GB의 스왑 파일이 생성됩니다.를 편집하다count당신의 취향에 따라.13000은 4MBx13000을 의미합니다.
  2. Mark it as swap: 스왑으로 표시
    sudo mkswap /swapfile
  3. Activate it: 활성화
    sudo swapon /swapfile

If you want to delete it, simply run sudo swapoff /swapfile and then rm /swapfile.
삭제할 경우 실행하기만 하면 됩니다.sudo swapoff /swapfile그리고 나서.rm /swapfile.

Run the models 모델 실행

I'll assume your LLaMA models are in 당신의 LLama 모델은 현재
~/Downloads/LLaMA.

  1. Open a terminal in your llama-int8 folder (the one you cloned).  터미널에서 폴더(복제된 폴더)룰 엽니다.
  2. Run: 
    python example.py --ckpt_dir ~/Downloads/LLaMA/7B --tokenizer_path ~/Downloads/LLaMA/tokenizer.model --max_batch_size=1
  3. You're done. Wait for the model to finish loading and it'll generate a prompt.
    모든 작업이 완료됩니다.모델의 로드가 완료될 때까지 기다리면 프롬프트가 생성됩니다.

Add custom prompts  커스텀 프롬프트 추가

By default, the llama-int8 repo has a short prompt baked in to example.py.
디폴트로는 lama-int8 repo에는 다음과 같은 짧은 프롬프트가 포함되어 있습니다.

  1. Open the "example.py" file in the "llama-int8" directory.
  2. Navigate to line 136. It starts with triple quotations, """.
    136행으로 이동합니다.처음에는 세 개의 인용구로 시작하지만
  3. Replace the current prompt with whatever you have in mind.
    현재 프롬프트를 원하는 프롬프트로 바꿉니다.

I'm getting shitty results!  결과가 안 좋아!

The inference code sucks for LLaMA. It only supports Temperature and Top_K. We'll have to wait until HF implements support for it (already in the works) so that it can properly show its true potential.
추론 코드가 LLama에겐 최악이야Temperature와 Top_K만 지원합니다.HF가 그 진정한 잠재력을 제대로 발휘할 수 있도록 지원(이미 진행 중)을 실시할 때까지 기다려야 합니다.

https://rentry.org/llama-tard

 

LLaMA INT8 Inference guide

DOWNLOAD THE CONVERTED WEIGHTS Some generous anon converted all the weights. Grab them here: https://rentry.org/LLaMA-8GB-Edition and https://rentry.org/llama-tard-v2 Huggingface implementation is available now! You can now convert the weights to a HF form

rentry.co

 

 

 

3. CUDA 메모리 부족 오류

그example.py파일은 다음 설정에 따라 캐시를 사전 준비합니다.

model_args: ModelArgs = ModelArgs(max_seq_len=max_seq_len, max_batch_size=max_batch_size, **params)

모델 무게(7B 모델)에 대해 14GB의 메모리를 차지하므로 2 * 2 * n_layer * max_batch_size * max_seq_len * n_heads * head_dim 바이트를 저장하는 디코딩 캐시에 16GB를 사용할 수 있습니다.

기본 파라미터의 경우 이 캐시는 7B 모델의 경우 약 17GB(2 * 2 * 32 * 32 * 1024 * 32 * 128)였습니다.

명령줄 옵션이 추가되어 있습니다.example.py디폴트를 변경했습니다.max_seq_len30GB GPU에서 디코딩이 가능한 최대 512입니다.

사용의 하드웨어에 따라서, 이러한 설정을 내려 주세요.

https://github.com/tloen/llama-int8/blob/main/FAQ.md#3

+ Recent posts