달력

072018  이전 다음

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  •  
  •  
  •  
  •  

'UTF-8'에 해당되는 글 1건

  1. 2009.05.21 파일 합치기
6000천개의파일을 하나로합쳐야한다.
또한파일들은 euc-kr이고 이것을 utf-8로 저장을 해야한다.
했던방법으로는
 
iconv -c -f euc-kr -t utf-8 ./*.xml > test-utf8.xml
more *.xml > test.xml (혹시몰라 cat *.xml > test.xml)
flyExplorer로 파일을합치기
C와Java로 파일열고 읽은다음에 파일쓰는거 짜기(C에서는 500개정도하면 멈춘다)


위와같은방법을 하면 파일이 깨져서 나오거나 중간에 쓰다가 멈추었다.
 
그래서 잠시 손을 놨다가 다시 시작을했는데 다음과 같은 명령어로하니 해결을 봤다.
 

 
utf-8로인코딩은 RedUTF8라는 프로그램으로 변경한뒤 커맨드창에서 type *.xml > test.xml
 
아놔.... 인코딩은 어려버. . .
그리고 또 느낀건 안되는걸 무조건 붙잡기보다는 윗 사람한테 물어보는 습관을 가져야겠다.
그리고 한글은 무조건 2바이트가 아니라는 점... 정말 중요하다(이건 다시 포스팅해야지)
문제를 해결 하려고하는 끈기도 중요하지만 환경설정이나 인코딩같은 건 물어봐야지...
UTF-8, euc-kr에 대해서 좀 깊게 공부해야지
Posted by 오산돌구