文字列のエンコード・デコード (encode/decode)

日本語文字列のエンコードとデコード。

Python

標準入力を読み、一行ずつエンコーディングを判定し、指定エンコーディングに統一して出力する。

import sys

ENC = "utf-8"  # 出力エンコード

for line in sys.stdin:
	try: dec = line.decode('iso2022-jp')
	except:
		try: dec = line.decode('ascii')
		except:
			try: dec = line.decode('utf-8')
			except:
				try: dec = line.decode('euc-jp')
				except:
					try: dec = line.decode('shift-jis')
					except:
						dec = "error"
	sys.stdout.write(dec.encode(ENC))

メニューに戻る