۱۳۸۶/۹/۲۲

سایتی برای نویسه گردانی جهت جستجوی صفحات عربی

سایت Yamli.com یک پایانه جستجوست که شما می توانید در آن صفحات عربی را با استفاده از حروف لاتین جستجو کنید. کلمات عربی نوشته شده با حروف لاتین به عربی نویسه گردانی (Transliteration) شده و جهت جستجو به Google پاس داده می شوند. Ramibotros در این باره چنین توضیح می دهد:

"وقتی ما، مردم عربی زبان، از طریق mail/sms/chat با هم ارتباط برقرار می کنیم، اغلب ترجیح می دهیم کلمات عربی را با حروف لاتین و به شکلی که در عربی تلفظ می شوند، بنویسیم (اغلب از قواعد تلفظ زبان انگلیسی برای این کار پیروی می شود). فکر کنم به این کار نویسه گردانی یا Transliteration می گویند (در فارسی چنین نوشتاری را فینگیلیش می گوییم). در این فرایند اغلب تلفظ ها هم نشان داده می شوند مگر درباره ی اعداد که آنها را به همان شکل 2، 7 و ... می نویسیم."

در ویکی پدیا توضیح بیشتری می یابید. Ramibotros می گوید:

من همیشه فکر می کردم که Google به چنین ابزاری نیاز داشته چون:

1- برای بعضی ها جستجوی کلمات عربی با استفاده از حروف لاتین راحت تر است (نسبت به تایپ مستقیم همان کلمات به زبان عربی). گاهی اوقات هم افراد به کیبوردی با حروف عربی دسترسی ندارند.

2- خیلی از صفحات وب از قبل در قالب نویسه گردانی نوشته شده اند و به همین خاطر به خوبی شاخص زده نمی شوند (Indexing) و بالطبع راحت هم پیدا نمی شوند.

3- برای یک جستجوی عربی مفیدتر آن است که بتوان از هر دو شکل نوشتن استفاده کرد.


به نقل از Google Blogoscoped


قضیه اینه: شما می رید توی سایت Yamli.com و کلمه ی مورد جستجوتون رو با حروف انگلیسی تایپ می کنید. اونوقت سایت معادل (های) عربی نویسی شده ی اون کلمه رو بهتون نشون می دهد و شما می تونید هر کدوم از دو شکل نوشتاری رو انتخاب کنید. هر کدوم رو که انتخاب کردید (با حروف عربی یا لاتین)، این سایت جستجوش رو به Google می سپره. یه صفحه جنبی هم هست که توش یه ادیتور خاص این کار (یا نویسه گردانی) کار گذاشته شده. یعنی اگه جایی بودین و دسترسی به صفحه کلید عربی نداشتید، می تونید برید و توی این ادیتور متن مورد نظرتون رو با حروف انگلیسی بنویسید و همون متن رو با حروف عربی تحویل بگیرید.

خبر خوب اینه که همه ی اینها (سایت جستجو و ادیتور) برای زبان ما هم کار می کنند و خبر بد اینکه حروف گچپژ که خاص زبان فارسی ست، در این ادیتور پشتیبانی نمی شوند. به نظرم ما فارسی زبان ها و ترکها هم واقعا به چنین ابزاری نیاز داریم. اگر کسی خواست کاری در این رابطه انجام دهد، من شخصا حاضر به همکاری هستم.

۲ نظر:

علی فتح‌اللهی گفت...

این کار رو من قبلاً انجام دادم و به صورت یک مقاله هم منتشر کردم. روش من استفاده از زنجیره پنهان مارکوف بود. اگه خواستی میتونم مقاله رو برات بفرستم. متأسفانه ابزارهای تهیه شده رو گم کردم ولی روش سر جاش هست. البته فکر کنم کار من با شکل کار این نرم افزار فرق میکنه

Naser گفت...

سلام علی جان
من خودم هم قبلا یه کارهایی رو این قضیه کردم. ممنون می شم اگه مقاله ات رو بفرستی.
اگه سایتی رو هم دیدین که خدمات مشابهی انجام می ده، ببینیمش.
به نظر خودم ممکنه سرویس به دربخوری بشه.