اكثر فایل های موجود بر روی اینترنت با استفاده از نرم افزارهایی نظیر WinZip
فشرده و بر روی سرویس دهندگان FTP مستقر هستند تا كاربران بتوانند با سرعت
مناسب اقدام به دریافت آنها نمایند. فایل های فشرده ZIP یكی از متداولترین و سهل
الوصول ترین نوع فایل های فشرده می باشند. با فشرده نمودن فایل ها امكان
ارسال سریعتر آنها بر روی اینترنت خصوصا" در مواردیكه سرعت خط ارتباطی
كاربران بالا نباشد ، فراهم می گردد. پس از دریافت فایل های فشرده با استفاده از
نرم افزارهای مربوطه نظیر WinZip می بایست آنها را به حالت اولیه تبدیل ( از حالت
فشرده خارج گردند ) كرد.
هدف از فشرده نمودن فایل ها كاهش ظرفیت فایل ها بوده و در زمان استفاده از
فایل می بایست مجددا" فایل به حالت اولیه برگردانده شود. در فرآیند فوق بیت
هایی از فایل با استفاده از الگوریتم هایی خاص ، از فایل حذف و زمینه كاهش
ظرفیت فایل فراهم خواهد شد. در زمان استفاده از فایل با استفاده از الگوریتم
فشرده سازی عملیات معكوس انجام و فایل به حالت اولیه خود برگردانده خواهد
شد. در ادامه به برخی از روش های فشرده سازی اطلاعات اشاره خواهد شد.
یافتن افزونگی در فایل
اكثرفایل های كامپیوتری ( با محتویات متفاوت ) دارای افزونگی اطلاعات می باشند.
این نوع فایل ها دارای اطلاعات تكراری زیادی می باشند. برنامه های فشرده سازی
اطلاعات ، اطلاعات تكراری موجود در فایل ها را بر اساس الگوریتم های مربوطه
حذف می نمایند. پس از تشخیص اطلاعات تكراری ، صرفا" اطلاعات تكراری یك بار در
فایل تكرار و و در سایر موارد، از مكانیزمهای خاصی برای عدم تكرار استفاده می
گردد.
جمله زیر از ۱۷ كلمه ، ۶۱ حرف ، ۱۶ فضای خالی ، یك نقطه و یك dash ، تشكیل
شده است :
"Ask not what your country can do for you — ask what you can do for your
country."
اگر هر یك از حروف ، فضای خالی و حروف خاص ، یك واحد از حافظه را اشغال
نمایند ، مجموعا" ۷۹ واحد از حافظه توسط عبارت فوق استفاده خواهد گردید (۷۹ =
۱ + ۱+ ۱۶ + ۶۱ ) . بمنظور كاهش ظرفیت فایل می بایست افزونگی اطلاعات در
فایل را بررسی كرد. با مشاهده و بررسی عبارت فوق ، نتایج زیر بدست می آید :
§ كلمه " ask" ، دو مرتبه تكرار شده است . § كلمه " what" ، دو مرتبه تكرار شده
است .
§ كلمه " your" ، دو مرتبه تكرار شده است .
§ كلمه "country" ، دو مرتبه تكرار شده است .
§ كلمه "can" ، دو مرتبه تكرار شده است .
§ كلمه " do" ، دو مرتبه تكرار شده است .
§ كلمه " for" ، دو مرتبه تكرار شده است .
§ كلمه "you" ، دو مرتبه تكرار شده است .
با عدم لحاظ نمودن حروف بزرگ و كوچك درعبارت فوق ، مشاهده می گردد كه
نیمی از اطلاعات موجود در عبارت فوق ، زاید و تكراری می باشند. با دقت در عبارت
فوق و نحوه افزونگی اطلاعات مشاهده می گردد كه با دارا بودن نه كلمه
ask,not,what,your,country,can ،do ،for و you می توان پالایشی مناسبی از
عبارت فوق را انجام و در صورت لزوم و با استفاده از نه كلمه فوق ، مجددا" عبارت
اولیه را ایجاد نمود. در این راستا و بمنظور ایجاد عبارت فوق كافی است به كلمات
موجود در بخش اول ( نصف عبارت ) اشاره و جایگاه و تعداد تكرار هر یك از آنها را در
بخش دوم مشخص نمود. در ادامه نحوه فشرده سازی اطلاعات و بازسازی مجدد
آنها بررسی می گردد.
فشرده سازی اطلاعات
اكثر برنامه های فشرده سازی از مدل ها ی متفاوت الگوریتم مبتنی بر دیكشنری
ایجاد شده توسط "Lempel و Ziv" ، بمنظور كاهش ظرفیت فایل ها ، استفاده می
نمایند. منظور از دیكشنری در الگوریتم فوق ، روش های كاتولوگ نمودن بخش هایی
از داده است . سیستم استفاده شده برای سازماندهی دیكشنری متفاوت و در
ساده ترین حالت می تواند شامل یك لیست عددی باشد. با مراجعه مجدد به عبارت
اشاره شده در بخش قبل ، كلمات تكراری را انتخاب و آنها را در لیست مرتب شده
ای بصورت زیر ایندكس می نماییم . پس از ایجاد لیست فوق ، می توان در مواردیكه
از كلمات در عبارت استفاده می شود ، از اعداد نسبت داده شده و متناظر با آنها
استفاده كرد.
دیكشنری ایجاد شده برای عبارت اشاره شده در بخش قبل بصورت زیر است :
ask
what
your
country
can
do
for
you
با توجه به دیكشنری ایجاد شده ، عبارت مورد نظر بصورت زیر خوانده خواهد شد :
"۱ not ۲ ۳ ۴ ۵ ۶ ۷ ۸ — ۱ ۲ ۸ ۵ ۶ ۷ ۳ ۴"
برای بازسازی مجدد عبارت فوق ، لازم است الگوی معادل آن را با توجه به
دیكشنری استخراج و در محل مربوطه قرار داد. برنامه هایی نظیر WinZip از
فرآیندهای مشابه برای بازسازی مجدد یك فایل و برگرداندن آن به شكل اولیه
استفاده می نمایند.
در فرآیند فشرده سازی عبارت اشاره شده در بخش قبل به شكل جدید آن ( مطابق
جدول بالا ) چه میزان ظرفیت فایل كاهش پیدا كرده است ؟ مطمینا" عبارت فشرده
شده ظرفیت كمتری نسبت به عبارت اولیه خواهد داشت . در این زمینه لازم است
به این نكته مهم اشاره گردد كه دیكشنری ایجاد شده نیز می بایست به همراه فایل
ذخیره گردد. در مثال فوق ، عبارت اولیه برای ذخیره سازی به ۷۹ واحد حافظه نیاز
داشت . عبارت فشرده شده ( بهمراه فضای خالی ) ، ۳۷ واحد و دیكشنری ( كلمات
و اعداد ) ، نیز ۳۷ واحد حافظه را اشغال خواهند كرد. بدین ترتیب ظرفیت فایل
فشرده به ۷۴ واحد حافظه خواهد رسید . با توجه به اطلاعات فوق مشاهده می
گردد كه عملا" در رابطه با فشرده سازی عبارت فوق به موفقیت های بزرگی نایل
نشده ایم . در این زمینه لازم است به این نكته اشاره گردد كه در مثال فوق ، صرفا"
یك " جمله " فشرده شده است . فرض كنید جمله فوق بخشی از یك سخنرانی یك
ساعته باشد ، بدیهی است كه در سخنرانی فوق احتمال تكرار كلمات فوق بسیار
زیاد خواهد بود . با ایجاد سیستم دیكشنری ، زمینه استفاده از آن در بخش های
بعدی سخنرانی نیز وجود داشته و در ادامه قطعا" میزان فشرده سازی جملات
موجود در متن سخنرانی نتایج مطلوبتری را بدنبال خواهد داشت .
__________________
مرا سر نهان گر شود زير سنگ -- از آن به كه نامم بر آيد به ننگ
به نام نكو گر بميــرم رواست -- مرا نام بايد كه تن مرگ راست
|