Experimental project

This is a sandbox project, which contains experimental code for developer use only.

This module provides one-way string transliteration (romanization) and cleans file names during upload by replacing unwanted characters for Japanese characters.

There is a useful module named Transliteration .
But,Transliteration Module chages strings from Japaese to Chinese.

Japanese Transliteration needs Morphological Analysis and Dictionary.
Basic Japanese Text Analysis Technology as a Platform for Knowledge Extraction | NTT Technical Review

This module uses KAKASI library for inverting Japnaese characters to US-ASCII characters.
KAKASI - Kanji Kana Simple Inverter
http://kakasi.namazu.org/index.html.en

There are many shared hosting services in Japan using KAKASI library.

+++++++++++++++++++++++++++++++++++++++++++++++++++

目次
---------------------

* はじめに
* インストール・設定
* 使い方
* 注意点

はじめに
---------------------

* 本モジュールは、マルチバイトから始まるファイル名をローマ字に変換して
Drupalにアップロードすることを目的としています。
(DrupalコアはUTF-8であってもASCII文字以外をアップロードされたファイル名から削除する仕様になっています。
ファイル名がマルチバイトから始まるファイルのアップロードする際に次の不具合が確認されています。
Using basename() is not locale safe | drupal.org

同様な機能を持つモジュールにTransliteration がありますが、中国語の読みに変換されてしまいますので、日本語の読みでローマ字化するためにこのモジュールを作成しました。

* 本モジュールは、日本語→ローマ字への変換に次のプログラムを利用します。
KAKASI - 漢字→かな(ローマ字)変換プログラム http://kakasi.namazu.org/

* KAKASI を使えるレンタル共用サーバーなど
動作実績/レンタルサーバー - PukiWiki-official

インストール・設定
---------------------

1. KAKASIのインストール
debian
apt-get install kakasi

2. jp_kakasi_transliterationモジュールを有効にします。
Administer → Site configuration → Kakasi setting
kakasiのフルパスを設定します。
ex: /usr/bin/kakasi
(パスが通っている場合は自動検出されます)

使い方
---------------------

* 「インストール・設定」が正しく行われますと自動的にファイルアップロード時に
日本語がローマ字に変換されます。

注意点
---------------------

* ファイル名に長音が含まれている場合長音が「^」と変換されますが、
本モジュールは「^」を空文字に置き換えます。
ex : ファイル名が「スペース.txt」の場合、「supesu.txt」となります。

* ファイル名に全角もしくは半角スペースが含まれている場合、「_」に置き換えます。

Project information

  • Created by qchan on , updated