본문 바로가기 메뉴 바로가기

컴맹 : 진화의 시작

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

컴맹 : 진화의 시작

검색하기 폼
  • 전체보기.. (877)
    • readme.md (1)
    • 사설 (11)
    • 개발 (473)
      • 개인 프로젝트 (13)
      • IT 컨퍼런스 후기 (25)
      • Linux (88)
      • Cloud (Alibaba) (4)
      • Cloud (AWS) (20)
      • Cloud (GCP) (48)
      • 기계학습 (13)
      • Network (18)
      • PHP (20)
      • python (32)
      • kubernetes (4)
      • docker (13)
      • IaC (10)
      • Vault (2)
      • Apache Airflow (7)
      • Java (1)
      • Node.js (7)
      • Vue.js (2)
      • DB (30)
      • GNU Build System (3)
      • 버전관리시스템 (15)
      • Shell Script (14)
      • Compile error (9)
      • 운영체제 (16)
      • CI.CD (1)
      • tools (15)
      • UML (10)
      • Link (18)
      • 길 잃은 게시물 (15)
    • 생활 (388)
      • 내 집 마련하기 (5)
      • 아빠일기 (0)
      • 주절주절 (172)
      • 리뷰 (39)
      • 외식 (20)
      • 책 (122)
      • 여행 (16)
      • 회고 (10)
      • 블로그 결산 (2)
      • 요리 (1)
      • 잡동사니 (1)
    • 비공개 (1)
      • -----아래는 비공개----- (1)
      • 코드 (0)
      • 임시 (0)
      • FS : 회사 대외비 (0)
      • Wedding : 준비 과정 (0)
      • 개인정보 (0)
  • 방명록

자모분리 (1)
한글 자모 분리

한글 자소분리를 처리하기 위해서는 Unicode에 대한 이해가 필요합니다. 우선 위키피디아에 정의되어 있는 한글 음절에 대해 살펴보도록 하시죠. https://ko.wikipedia.org/wiki/한글_음절 우선 여기서 잘 확인하고 넘어가야 하는 부분이 초성, 중성, 종성을 이루는 문자들과 그 개수입니다. 초성 : ㄱㄲㄴㄷㄸㄹㅁㅂㅃㅅㅆㅇㅈㅉㅊㅋㅌㅍㅎ (19개) 중성 : ㅏㅐㅑㅒㅓㅔㅕㅖㅗㅘㅙㅚㅛㅜㅝㅞㅟㅠㅡㅢㅣ (21개) 종성 : ㄱㄲㄳㄴㄵㄶㄷㄹㄺㄻㄼㄽㄾㄿㅀㅁㅂㅄㅅㅆㅇㅈㅊㅋㅌㅍㅎ (28개) 종성의 경우에는 종성이 없는 경우를 위해서 빈 문자도 포함해서 28로 취급합니다. 예를들면 "가", "우", "소" 등이 종성이 없는 경우가 있겠죠. 또한 위 링크에서 확인한 한글문자코드의 범위는 0xAC00(가) ~ ..

개발/python 2019. 5. 2. 16:39
이전 1 다음
이전 다음
최근에 올라온 글
최근에 달린 댓글
글 보관함
Total
Today
Yesterday

Blog is powered by Tistory / Designed by Tistory

티스토리툴바