دسته بندی | علوم انسانی |
بازدید ها | 0 |
فرمت فایل | doc |
حجم فایل | 39 کیلو بایت |
تعداد صفحات فایل | 53 |
گزارش کارآموزی بانک اطلاعاتی در 53 صفحه ورد قابل ویرایش
فهرست مطالب
عنوان صفحه
فصل اول
بانک اطلاعاتی چیست .................................................................................... 3
استفاده از سیستم های اطلاعاتی ساده .......................................................... 3
استفاده از بانک اطلاعاتی ................................................................................ 3
مزایای استفاده از بانک اطلاعاتی .................................................................... 4
معایب استفاده از بانک اطلاعاتی...................................................................... 5
اجزای تشکیل دهنده بانک اطلاعاتی ............................................................. 5
بانک اطلاعاتی SQL ...................................................................................... 6
تاریخچه SQL ............................................................................................... 6
زبان SQL ...................................................................................................... 7
نقش SQL ..................................................................................................... 9
قابلیت ها و مزایای SQL .............................................................................. 11
استقلال فروشنده ......................................................................................... 12
قابلیت استفاده از انواع سیستم های کامپیوتری .......................................... 12
استانداردهای SQL ...................................................................................... 13
تأیید IBM ................................................................................................... 14
پایه و اساس رابطه ای SQL ......................................................................... 14
زبان کامل بانک اطلاعاتی ............................................................................... 14
تعریف داده ها در هر زمان ............................................................................. 15
مقدمه ای بر دلفی .......................................................................................... 15
مزایای دلفی .................................................................................................. 16
انواع داده ها در دلفی ..................................................................................... 16
روش طراحی برنامه شیء گرا ......................................................................... 17
آنچه برای نصب دلفی نیاز است ..................................................................... 17
نصب و راه اندازی دلفی ................................................................................. 18
اجزای سازنده برنامه دلفی ............................................................................. 19
چگونه با دلفی برنامه بنویسیم ....................................................................... 20
انواع فایلها در دلفی ....................................................................................... 22
اجرای دستورات SQL در دلفی .................................................................... 23
خلاصه فصل اول ............................................................................................ 25
فصل دوم
شناخت سیستم.............................................................................................. 26
برنامه ریزی سیستم تاکسی تلفنی................................................................. 26
تقسیم بندی کل سیستم................................................................................ 28
چارت سازمانی................................................................................................. 29
شرح وظایف نمودار سازمانی........................................................................... 30
شکل ظاهری محل........................................................................................... 31
زمان بندی پروژه............................................................................................ 32
نمودار CPM(ctitical Path method)...................................................... 33
نمودارهای DFD(Data flow Diagram)................................................. 36
نمودارهای DSD............................................................................................ 38
خلاصه فصل دوم............................................................................................. 41
فصل سوم
فرم ها و کدهای به کار رفته در پروژه.............................................................. 42
بانک اطلاعاتی چیست؟
در بانک اطلاعاتی تعاریف گوناگونی شده است که تعریف زیر از همه جامع تر به نظر می رسد : بانک اطلاعاتی مجموعه ای سازمان یافته از اطلاعات و داده های مرتبط به هم است. داده ها عبارت اند از : حقایق و ارقام یک موضوع خاص و اطلاعات عبارت اند از نتایجی که از ترکیب داده ها حاصل می گردند. مؤسسات و سازمان معمولاً سیستم های اطلاعاتی خود را به دو صورت تشکیل داده از آن ها استفاده می کنند.
استفاده از سیستم های اطلاعاتی ساده
در این روش در فایل های جداگانه قرار می گیرند و برای استفاده از داده های موجود در آن فایل ها، سیستم های جداگانه ای طراحی می شوند. به این نوع سیستم های اطلاعاتی سیستم پردازش فایل ها می گویند.
استفاده از بانک های اطلاعاتی
در این روش داده های موجود، به صورت مجتمع یا بانک مورد استفاده قرار می گیرند در چنین سیستمی کاربر می تواند بدون سر درگمی با صرف وقت اندکی، اطلاعات مورد نیاز خود را از داده های موجود در بانک اطلاعاتی اخذ کند. امروزه اکثر مؤسسات و سازمان ها سعی می کنند از سیستم اطلاعاتی استفاده کنند. برای پی بردن به تفاوت دو روش ذکر شده مؤسسه ای را در نظر بگیرید که داده های مربوط به حقوق کارمندان، بیمه ، تنبیه و تشویق را در چهار فایل جداگانه قرار داده برای اخذ خروجی های مورد نیاز، سیستم های جداگانه ای برای آن ها نوشته است.
کار سیستم حقوق، محاسبه دستمزد کارکنان با استفاده از داده های موجود در فایل حقوق، کار سیستم بیمه، پردازش داده های موجود در فایل بیمه و کار سیستم های تنبیه و تشویق، پردازش داده های موجود در فایل های تنبیه و تشویق می باشد. هریک از این سیستم ها می توانند خروجی مناسبی را تولید کنند، اما اگر بخواهیم اطلاعات جدیدی مانند آنچه در زیر آمده است اخذ کنیم، با مشکل مواجه خواهیم شد.
1.کارمندانی که دارای حقوق مشخصی بوده به تعداد دفعات مشخصی تنبیه یا تشویق شده اند.
2 . کارمندانی که در تاریخ معینی استخدام شده مبلغ خاصی برای آن ها از طرف بیمه هزینه شده است.
3. کارمندانی که تعداد دفعات تنبیه آن ها بیشتر از تعداد دفعات تشویق باشد و برعکس.
در همه موارد بالا و مواردی مشابه مجبوریم از داده های موجود در دو یا چند فایل استفاده کنیم که کار ساده ای نیست. زیرا ممکن است داده های موجود در فایل ها دارای فرمت یکسانی نباشند. در حالی که اگر مؤسسه سیستم اطلاعاتی خود را به صورت بانک اطلاعاتی تشکیل دهد با چنین مشکلی مواجه نخواهد شد. شکل 2-9 نشان دهنده سیستم بانک اطلاعاتی مؤسسه سابق الذکر است.
در سیستم جدید، تمامی داده های موجود در فایل های طراحی شده در روش اول، در یک فایل بزرگ تر به نام بانک اطلاعاتی قرار می گیرند که در نتیجه پردازش داده ها و اخذ گزارش های جدید آسان تر خواهد بود.
مزایای استفاده از بانک اطلاعاتی
مزایای استفاده از سیستم بانک اطلاعاتی به جای سیستم پردازش فایل ها را می توان چنین برشمرد :
1. جلوگیری از اتلاف حافظه در ذخیره کردن داده ها
2. ایجاداطمینان نسبت به گزارش های به دست آمده
3. اخذ گزارش های جدید ساده است.
4. سرعت پردازش داده ها بالاست.
5. داده ها از سیستم های کاربردی مستقل هستند.
6. تمرکز در مدیریت داده ها به خوبی امکان پذیر است.
معایب استفاده از سیستم بانک اطلاعاتی
بانک اطلاعاتی با همة مزایایش، معایبی نیز دارد که این معایب در مقابل مزایای فوق ناچیزند، از جمله :
1. چون طراحی بانک های اطلاعاتی ساده نیست، جهت ایجاد آن به متخصصان ماهری نیاز است.
2. به دلیل متمرکز بودن سیستم اطلاعاتی، امکان آسیب پذیری سیستم زیاد است. یعنی، اگر یک قیمت از سیستم از کار بیفتد، ممکن است در کار بقیه قسمت ها خلل ایجاد شود.
اجزای تشکیل دهنده بانک اطلاعاتی
1. کاربران
2. سیستم بانک های اطلاعاتی
3. داده های موجود در بانک های اطلاعاتی
کاربران کسانی هستند که به نحوی به بانک اطلاعاتی سروکار دارند. بر اساس نوع کاری که کاربران با بانک اطلاعاتی دارند، می توان آن ها را به سه دسته تقسیم کرد:
1. مدیر یا مسئول بانک اطلاعاتی
2. برنامه نویسان کاربردی یا طراحان بانک های اطلاعاتی
3. کاربران نهایی
کاربران نهایی کسانی هستند که حق هیچ گونه تغییر و تبدیل را در بانک اطلاعاتی ندارند، بلکه فقط از امکانات آن می توانند استفاده نمایند. طراحان بانک های اطلاعاتی کسانی هستند که بانک اطلاعاتی را ایجاد نموده اند. مسئول بانک اطلاعاتی کسی است که حق هر گونه تبدیل و تغییر را در بانک اطلاعاتی دارد. به عنوان مثال اضافه کردن داده های جدید و حذف یا اصلاح داده ها به عهده مسئول بانک اطلاعاتی است. سیستم بانک اطلاعاتی مجموعه ای از برنامه هایی است که نیازهای کاربران را برآورده می کند.
بانک اطلاعاتی SQL
تاریخچه SQL
محبوبیت رو به رشد SQL یکی از مطالب مهم در صنعت امروزی کامپیوتر می باشد. در عرض چند سال گذشته، SQL زبان استاندارد در بانک های اطلاعاتی کامپیوتری گردیده است. اکنون بیش از 100 محصول مدیریت بانک اطلاعاتی بر روی سیستم های کامپیوتری از کامپیوترهای شخصی گرفته تا کامپیوترهای بزرگ ، SQL را پشتیبانی می کنند. یک استاندارد رسمی بین المللی برای SQL تهیه گردیده، و SQL نقش اساسی را در استاندارد IBM’s Systems Application Architecture بازی می کند. مجلات کامپیوتری، در عنوان های خود پیدایش SQL را بعنوان یک زبان تبریک می گویند. از ابتدای کار آن در IBM ، SQL هم بعنوان یک پروژه تحقیقاتی، هم بعنوان یک تکنولوژی کامپیوتری و هم بعنوان یک نیروی غالب در بازار خود را نشان داده است.
اما SQL واقعاً چیست؟ چرا اهمیت دارد؟ اگر واقعاً SQL یک استاندارد است، پس چرا نسخه های آن انواع مختلف دارد؟ آیا SQL واقعاً در کامپیوترهای شخصی قابل اهمیت است؟ آیا می تواند پاسخگوی نیازهای سطح بالای انتقال داده ها باشد؟ با توجه به نحوه استفاده شما از کامپیوتر، SQL چه می تواند انجام دهد، و شما چگونه می توانید از این ابزار مدیریت داده ها استفاده کنید.
زبان SQL
SQL وسیله ای است برای سازماندهی، مدیریت و بازیابی داده هایی که توسط بانک اطلاعاتی در کامپیوتر ذخیره شده اند. نام SQL از عبارت Structured Query Language و نیز به شکل SQL تلفظ می شود. همانطور که از نام آن بر می آید، SQL یک زبان کامپیوتری است، که برای یک بانک اطلاعاتی از آن استفاده می شود. در حقیقت، SQL با یک نوع بانک اطلاعاتی بنام بانک اطلاعاتی رابطه ای یا relational database کار می کند.
اگر سیستم کامپیوتری مربوط به یک کار تجاری باشد، بانک اطلاعاتی داده های مربوط به انبارداری، تولید، فروش و یا حقوق و دستمزد را نگهداری می کند. در یک کامپیوتر شخصی، بانک اطلاعاتی معمولاً داده های مربوط به چک های صادره، لیست های پرسنلی و شماره تلفن آنها، و یا داده های استخراج شده از یک سیستم کامپیوتری بزرگتر را نگهداری می کند. برنامه کامپیوتری که بانک اطلاعاتی را کنترل می کند، سیستم مدیریت بانک اطلاعاتی یا database management system و یا اختصاراً DBMS نامیده می شود.
وقتی می خواهید داده هایی را از بانک اطلاعاتی بازیابی کنید، برای اجرای کار نیاز به SQL دارید. DBMS پرسش SQL را مورد پردازش قرار داده، داده های مورد نظر را بازیابی نموده، و نتیجه را به شمار برمی گرداند. این نوع پردازش داده های درخواستی از یک بانک اطلاعاتی و دریافت نتایج، یک database queruy یا پرسش از بانک اطلاعاتی است، لذا Struetured Query Language برای کاربران خود فراهم می کند، از آن جمله :
تأیید IBM
SQL ابتدا بوسیله پویندگان شرکت IBM ساخته شد، و از آن زمان تاکنون بعنوان یک محصول استراتژیکی IBM شناخته شده است. SQL یک جزء اساسی از Systems Application Architecture یا SAA می باشد، که رونوشت یا کپی شرکت IBM است برای ایجاد هماهنگی در خطوط مختلف تولید آن هر چهار خانواده ای که در زیر چتر SAA قرار دارند، SQL را حمایت می کنند، این چهار خانواده عبارت اند از کامپیوترهای شخصی PS/2 ، سیستم های AS/400 ، و کامپیوترهای بزرگی که سیستم های عامل MVS و VM را اجرا می کنند. این پشتیبانی گسترده IBM باعث تسریع بازار SQL شده و سبب گردیده که دیگران نیز از آن تبعیت کنند.
پایه و اساس رابطه ای SQL
SQL زبانی است برای بانک های اطلاعاتی رابطه ای، و بعنوان یک مدل بانک اطلاعاتی رابطه ای مشهور شده است. ساختار جدولی یا سطر و ستونی یک بانک اطلاعاتی رابطه ای برای کاربران قابل درک بوده، و باعث می شود که زبان SQL ساده و قابل درک باشد. در ضمن مدل رابطه ای یک اساس قوی تئوریک دارد که باعث تکامل تدریجی بانک های اطلاعاتی رابطه ای شده است.
زبان کامل بانک اطلاعاتی
SQL ابتدا بعنوان یک زبان پرسشی موردی ساخته شد، اما قابلیت های فعلی آن فراتر از کار بازیابی داده ها است. SQL یک زبان کامل برای ایجاد بانک اطلاعاتی، مدیریت صحیح آن، تغییر محتوای آن، و در شبکه قرار دادن داده ها در بین کاربران مختلف است. مفاهیم SQL که یک قسمت از این زبان را شامل می شود، قابل تعمیم به دیگر دستورات آن نیز می باشد.
تعریف داده ها در هر زمان
با استفاده از SQL می توان هر زمان ساختار یک بانک اطلاعاتی را تغییر و یا توسعه داد، حتی در زمانی که کاربران در حال استفاده از محتوای آن می باشند. این یک قابلیت مهم نسبت به زبان هایی است که تعریف داده ها در آنها حالت سکون و غیرپویا دارد. به این ترتیب SQL دارای حداکثر قابلیت انعطاف بوده، و در حالیکه برنامه های کاربردی بطور Om-limc کار می کنند، می توان بانک اطلاعاتی را تغییر داد.
از طرز کار آنها، SQL را آموزش می دهد. اگر چه همواره نحوة نگارش هر دستور را نمایش خواهیم داد لکن بیشتر بر مسائلی که توسط هر دستور حل شوند و نیز به نحوة به کارگیری این دستورات برای حل هر مسئله تأکید خواهیم کرد و برای روشنتر شدن موضوع از مثالهای واقعی با توضیحات کامل، استفاده خواهیم کرد. امروز موضوعات زیر را می آموزید:
· تاریخچة SQL Server
· نحوة استفاده از SQL در کاربردهای واقعی
· نحوة اتصال به پایگاه داده ها از طریق ابزار جدید Query Analyzer (تحلیل گرپرسش)
· نحوة نوشتن و اجرا کردن اولین پرسش SQL
مقدمه ای بر دلفی
مدتی است که دلفی به عنوان یک زبان قدرتمند، طرفداران زیادی پیدا کرده است و از الگوهای زبان پاسکال شیء گرا پیروی می کند. زبان دلفی در محیط ویندوز به کار گرفته می شود. می گویند دلفی قابلیت RAD دارد. RAD به معنی تولید سریع برنامه است. علتش این است که بخش بسیار زیادی از کد برنامه توسط دلفی ایجاد می شود. محیط دلفی را IDE به معنی محیط توسعه مجتمع می نامید، زیرا در این محیط ویراستار، کامپایلر، پیوند دهنده همگی با هم و در کنار هم کار می کنند.
مزایای دلفی
انعطاف پذیری دلفی بسیار زیاد است و کاربران به آسانی با دلفی ارتباط برقرار می کنند. می دانید که برنامه نویسان معمولاً کاربران کامپیوتر نیستند. یعنی برنامه نویسان، پس از تکمیل برنامه، آن را در اختیار افراد دیگری به نام کاربران قرار می دهند تا از آن ها استفاده کنند. به عبارت دیگر، یک فایل اجرایی (exe) در اختیار کاربران قرار می گیرد. در نتیجه می توان یک برنامه نصب ساده ای نوشت تا عمل نصب برنامه را انجام دهد. قابلیت اجرای برنامه ها، ایجاد قطعات و به کارگیری قطعات در برنامه ها بسیار آسان است.
انواع داده در دلفی
یکی از جنبه های مهم هر زبان برنامه سازی که باید مورد بررسی قرار گیرد، انواع داده های آن است. ما روزمره با داده هایی مثل میزان خرید روزانه و اسامی افراد سروکار داریم. خرید روزانه را به صورت اعدادی مثل 1500، 5/413 و اسامی افراد را با کلماتی مثل علی، احمد و رضا بیان می کنیم . انواع داده ها در دلفی عبارت اند از :
· داده های نوع صحیح 10، 20و 125 · داده های بولی (boolean)
· داده های نوع حقیقی مثل 5/14 . 25/5 · داده های کاراکتری مثل A B و C
· داده های نوع ارزی (Currency) · داده های رشته ای مثل Science , Ali
روش طراحی برنامه شیء گرا
برای طراحی و ایجاد برنامه شیء گرا باید مراحلی را انجام داد. این مراحل را در این جا مورد بحث قرار می دهیم.
1. تعیین نیازمندی های مسئله
2. تحلیل مسئله
3. طراحی کلاس هایی که باید مسئله را حل کنند، این کار با انجام موارد زیر امکان پذیر است:
الف . پیدا کردن کلاس موجود و اصلاح شده
ب.اصلاح کلاس های موجود، در صورت نیاز
ج. طراحی کلاس های جدید، در صورت لزوم
4. پیاده سازی کلاس های جدید
5. تست و بررسی کل برنامه
6. نگهداری و بازسازی برنامه
آنچه که برای نصب دلفی نیاز است
برای نصب دلفی به نرم افزار و سخت افزار خاصی نیاز دارید که عبارت اند از :
1. ویندوز 95، 98 ، 2000 یا xp
2. کامپیوتر 486 یا ترجیحاً پنتیوم با حداقل 32 مگابایت به همراه CD-ROM
3. دیسک سخت که حداقل 40 مگابایت فضای خالی داشته باشد.
4. دستگاه ماوس برای سرعت انجام کار با دلفی
خلاصه فصل اول :
بانک اطلاعاتی با همه مزایایی که دارد از جمله : جلوگیری از اتلاف حافظه در ذخیره کردن داده ها، ایجاد اطمینان نسبت به گزاره های بدست آمده و داده ها از سیستم های کاربردی مستقل هستند و ... معایبی نیز این بانک اطلاعاتی دارد که این معایب در مقابل مزایای آن ناچیز است. همچنین SQL یک سیستم مدیریت بانک اطلاعاتی نیست در ضمن یک محصولی هم نیست که به تنهایی قابل استفاده باشد. یعنی اینکه نمی توان SQL را از جایی خریداری کنید بلکه SQL یک زبان برنامه نویسی بانک اطلاعاتی است.
دسته بندی | کامپیوتر و IT |
بازدید ها | 0 |
فرمت فایل | doc |
حجم فایل | 6485 کیلو بایت |
تعداد صفحات فایل | 242 |
بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005 پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان
1-1-مقدمه
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد .با استفاده از ابزارهای گوناگون گزارش گیری معمولی ، می توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه گیری در مورد داده ها و روابط منطقی میان آنها بپردازند اما وقتی که حجم داده ها خیلی بالا باشد ، کاربران هر چند زبر دست و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه داده ها تشخیص دهند و یا اگر قادر به این کار هم با شوند ، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است .از سوی دیگر کاربران معمولا فرضیه ای را مطرح می کنند و سپس بر اساس گزارشات مشاهده شده به اثبات یا رد فرضیه می پردازند ، در حالی که امروزه نیاز به روشهایی است که اصطلاحا به کشف دانش[1] بپردازند یعنی با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه های منطقی را بیان نمایند .
داده کاوی[2] یکی از مهمترین این روش ها است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند .
اصلی ترین دلیلی که باعث شده داده کاوی کانون توجهات در صنعت اطلاعات قرار بگیرد، مساله در دسترس بودن حجم وسیعی از داده ها و نیاز شدید به اینکه از این داده ها, اطلاعات و دانش سودمند استخراج کنیم. اطلاعات و دانش بدست آمده در کاربردهای وسیعی مورد استفاده قرار می گیرد.
داده کاوی را می توان حاصل سیر تکاملی طبیعی تکنولوژی اطلاعات دانست، که این سیر تکاملی ناشی از یک سیر تکاملی در صنعت پایگاه داده می باشد، نظیر عملیات جمع آوری داده ها وایجاد پایگاه داده، مدیریت داده و تحلیل و فهم داده ها.
تکامل تکنولوژی پایگاه داده و استفاده فراوان آن در کاربردهای مختلف سبب جمع آوری حجم فراوانی داده شده است. این داده های فراوان باعث ایجاد نیاز برای ابزارهای قدرتمند برای تحلیل داده ها گشته، زیرا در حال حاضر به لحاظ داده ثروتمند هستیم ولی دچار کمبود اطلاعات می باشیم.
ابزارهای داده کاوی داده ها را آنالیز می کنند و الگوهای داده ها را کشف می کنند که می توان از آن در کاربردهایی نظیر تعیین استراتژی برای کسب و کار، پایگاه دانش[3] و تحقیقات علمی و پزشکی، استفاده کرد. شکاف موجود بین داده ها و اطلاعات سبب ایجاد نیاز برای ابزارهای داده کاوی شده است تا داده های بی ارزش را به دانشی ارزشمند تبدیل کنیم .
1
-3-داده کاوی و مفهوم اکتشاف دانش (K.D.D)
با حجم عظیم داده های ذخیره شده در فایلها، بانکهای اطلاعاتی و سایر بانک های داده ای، توسعه ی ابزارهایی برای تحلیل و شاید تفسیر چنین داده هایی و برای استخراج علوم شگفت انگیزی که می توانند در تصمیم گیری مفید باشند، امری بسیار مهم و ضروری است. داده کاوی با عنوان کشف دانش در پایگاه های داده (KDD) شناخته میشود. کشف علومی که قبلا ناشناخته بودهاند و اطلاعاتی که در بانکهای اطلاعاتی موجود بوده و ذاتا بالقوه و مفید هستند.
با وجود آنکه داده کاوی و کشف دانش در پایگاههای داده مترادف همدیگر هستند، ولی در اصل، داده کاوی ذاتاً بخشی و تنها قسمتی جزئی از فرآیند کشف دانش است. فرآیند کشف دانش در بر گیرنده ی چندین مرحله می باشد که از اطلاعات خام، گونه هایی از علوم جدید را بدست می دهد. مراحل کشف دانش به قرار زیر است:
1- پاکسازی داده ها : در این فاز داده های اضافی و نامربوط از مجموعه داده ها حذف می شوند.(داده های ناکامل) [2]
2-یکپارچه سازی داده ها[4] : چندین منبع داده ترکیب می شوند،
3-انتخاب داده ها : انبار داده ها شامل انواع مختلف و گوناگونی از داده ها است که همه آنها در داده کاوی مورد نیاز نیستند . برای فرایند داده کاوی باید داده ها ی مورد نیاز انتخاب شوند . به عنوان مثال در یک پایگاه داده های مربوط به سیستم فروشگاهی ، اطلاعاتی در مورد خرید مشتریان ، خصوصیات آماری آنها ، تامین کنندگان ، خرید ، حسابداری و ... وجود دارند . برای تعیین نحوه چیدن قفسه ها تنها به داده ها یی در مورد خرید مشتریان و خصوصیات آماری آنها نیاز است . حتی در مواردی نیاز به کاوش در تمام محتویات پایگاه نیست بلکه ممکن است به منظور کاهش هزینه عملیات ، نمونه هایی از عناصر انتخاب و کاوش شوند .
4-تبدیل داده ها : هنگامی که داده های مورد نیاز انتخاب شدند و داده های مورد کاوش مشخص گردیدند، معمولا به تبدیلات خاصی روی داده ها نیاز است. نوع تبدیل به عملیات و تکنیک داده کاوی مورد استفاده بستگی دارد، تبدیلاتی ساده همچون تبدیل نوع داده ای به نوع دیگر تا تبدیلات پیچیده تر همچون تعریف صفات جدید با انجام عملیاتهای ریاضی و منطقی روی صفات موجود.
5-داده کاوی : بخش اصلی فرایند ، که در آن با استفاده از روش ها و تکنیک های خاص ، استخراج الگو های مفید ، دانش استخراج می شود.
6-زیابی الگو[5] : مشخص کردن الگوهای صحیح و مورد نظر به وسیله معیارهای اندازه گیری.
7-زنمایی دانش : در این بخش به منظور ارائه دانش استخراج شده به کاربر ، از یک سری ابزارهای بصری سازی استفاده می گردد.
1-3-1-تعریف داده کاوی
در متون آکادمیک تعاریف گوناگونی برای داده کاوی ارائه شده اند . در برخی از این تعاریف داده کاوی در حد ابزاری که کاربران را قادر به ارتباط مستقیم با حجم عظیم داده ها می سازد معرفی گردیده است و در برخی دیگر ، تعاریف دقیقتر که درآنها به کاوش در داده ها توجه می شود. برخی از این تعاریف عبارتند از :
همانگونه که در تعاریف گوناگون داده کاوی مشاهده می شود ، تقریبا در تمامی تعاریف به مفاهیمی چون استخراج دانش ، تحلیل و یافتن الگوی بین داده ها اشاره شده است .
1-3-2- فرآیند دادهکاوی
میتوان فرآیند دادهکاوی را طی مراحل زیر به صورت نمودار نشان داد.
|
|
|
|
||||
|
|
|
شکل 1-1فرآیند دادهکاوی
در فرآیند بالا، دادههای خام از منابع مختلفی جمعآوری میشوند و ازطریق استخراج، ترجمه و فرآیندهای بازخوانی به انبار دادهها وارد میشوند. بخش مهیاسازی، دادهها از انبار خارج شده و به صورت یک فرمت مناسب برای دادهکاوی درمیآیند. در بخش کشف الگو از روشها والگوریتمهای دادهکاوی، برای ساخت الگو استفاده میشود.
1-3-3- قابلیت های داده کاوی
باید توجه داشته باشید که داده کاوی یک ابزار جادویی نیست که بتواند در پایگاه داده شما به دنبال الگوهای جالب بگردد و اگر به الگویی جدیدی برخورد کرد آن را به شما اعلام کند بله صرفا الگوها و روابط بین داده ها را به شما اعلام می کند بدون توجه به ارزش آنها. بنابراین الگوهایی که به این وسیله کشف می شوند باید با جهان واقع تطابق داشته باشند.[5]
1-3-4-چه نوع دادههایی مورد کاوش قرار می گیرند؟
در اصل داده کاوی مختص یک رسانه یا دادهی خاص نیست و باید از قابلیت اجرا بر روی هر نوع داده ای برخوردار باشد، اگر چه الگوریتمها و تلاشها ممکن است در مواجهه با گونه های مختلف داده، تفاوت داشته باشند.
رایج ترین منبع برای الگوریتم های دادهکاوی هستند، خصوصا در مرحله ی تحقیق، فایل های ساده، فایل های ساده ی متنی یا با ساختار دودویی هستند و با ساختاری شناخته شده برای یک الگوریتم مشخص داده کاوی که روی آن پیاده می شود. داده های درون این نوع فایل ها می توانند تراکنش ها، داده های سریالی، اندازه گیری های عملی و ... باشند.
مختصرا، یک پایگاه داده ی رابطه ای متشکل از مجموعهای از جداول است که در بر گیرندهی مقادیری برای صفات موجودیت ها و یا مقادیری از روابط بین موجودیت ها میباشد. هر جدول دارای چندین سطر و ستون میباشد که ستونها ارائه کنندهی صفات خاصه و سطرها ارائه کنندهی رکوردهای اطلاعاتی میباشند. یک رکورد اطلاعاتی در بر گیرندهی صفات خاصهی یک شئ یا روایط بین اشیا است که با یک کلید غیر تکراری تعریف میشود. الگوریتم های دادهکاوی برای پایگاههای دادهای رابطهای بسیار فراگیرتر و سریعتر از الگوریتم های دادهکاوی روی فایلهای ساده هستند.
وجود اطلاعات صحیح و منسجم یکی از ملزوماتی است که در داده کاوی به آن نیازمندیم. اشتباه و عدم وجود اطلاعات صحیح باعث نتیجه گیری غلط و در نتیجه اخذ تصمیمات ناصحیح در سازمانها می گردد و منتج به نتایج خطرناکی خواهد گردید که نمونه های آن کم نیستند .
اکثر سازمانها دچار یک شکاف اطلاعاتی[7] هستند. در اینگونه سازمان ها معمولا سیستم های اطلاعاتی در طول زمان و با معماری و مدیریت های گوناگون ساخته شده اند ، به طوری که درسازمان، اطلاعاتی یکپارچه و مشخصی مشاهده نمی گردد . علاوه بر این برای فرایند داده کاوی به اطلاعات خلاصه و مهم در زمینه تصمیم گیری های حیاتی نیازمندیم .
هدف از فرایند انبارش داده ها فراهم کردن یک محیط یکپارچه جهت پردازش اطلاعات است . در این فرایند ، اطلاعات تحلیلی و موجز در دوره های مناسب زمانی سازماندهی و ذخیره می شود تا بتوان از آنها در فرایند های تصمیم گیری که از ملزومات آن داده کاوی است ، استفاده شود . به طور کلی تعریف زیر برای انبار داده ها ارائه می گردد : انبار داده ها ، مجموعه ای است موضوعی[8] ، مجتمع[9] ، متغیر در زمان[10] و پایدار[11] از داده ها که به منظور پشتیبانی از فرایند مدیریت تصمیم گیری مورد استفاده قرار می گیرد.
1-4- وظایف داده کاوی
وظایف داده کاوی معمولا بشرح زیر است:
1-1-4-کلاس بندی
هدف کلاسبندی دادهها، سازماندهی و تخصیص دادهها به کلاسهای مجزا میباشد. در این فرآیند بر اساس دادههای توزیع شده، مدل اولیهای ایجاد میگردد. سپس این مدل برای طبقهبندی دادههای جدید مورد استفاده قرار میگیرد، به این ترتیب با بکارگیری مدل بدست آمده، تعلق دادههای جدید به کلاس معین قابل تعیین میباشد. کلاسبندی در مورد مقادیر گسسته و پیشگویی بهکار میرود. [6]
در فرآیند کلاسبندی، اشیا موجود به کلاسهای مجزا با مشخصههایی تفکیکشده (ظروف جداگانه) طبقهبندی و به صورت یک مدل معرفی میگردند. سپس با در نظر گرفتن ویژگیهای هر طبقه، شی جدید به آنها تخصیص یافته، برچسب و نوع آن قابل تعیین می گردد.
در کلاسبندی، مدل ایجاد شده بر پایهی یکسری دادههای آموزشی، (اشیا دادههایی که بر چسب کلاس آنها مشخص و شناخته شده است) حاصل می آید. مدل بدست آمده در اشکال گوناگون مانند قوانین کلاسبندی (If-Then)، درختهای تصمیم، فرمولهای ریاضی و شبکههای عصبی قابل نمایش میباشد.
به عنوان مثال فرض کنید مدیر فروشگاهی در نظر دارد مجموعهی بزرگی از دادهها را بر اساس میزان فروش به زیاد، متوسط و کم طبقهبندی کند. وی میبایست مدلی ایجاد کند که بر اساس خصیصههای کالا مانند قیمت، مارک، محل ساخت و نوع کالا، کلاس مربوط به آن نوع کالا را تعیین نماید. طبقهبندی نهایی میبایست به طور ماکزیمال هر کلاسی را از دیگری تشخیص داده،و تصویر سازماندهی شدهای از دادهها را به نمایش در آورد. [7]
از کاربردهای کلاسبندی می توان بازاریابی، تشخیص بیماری، تحلیل اثرات معالجه، تشخیص خرابی در صنعت و تعیین اعتبار را نام برد. [6]
1-4-2- مراحل یک الگوریتم کلاسبندی
الگوی عمومی برای الگوریتمهای آموزش از طریق مثال با فرایند کلاسبندی به سه مرحله تقسیم میشوند:[2]
1-4-3- انواع روشهای کلاسبندی
کلاسبندی به روشهای زیر انجامپذیر است:
· طبقهبندی بیز
· درخت تصمیم
· K-Nearest Neibour
· الگوریتمهای ژنتیک
· شبکههای عصبی
1-4-3-1- درخت تصمیم
درخت تصمیم عبارت است از یک مجموعه قوانین برای تقسیم کردن یک مجموعه ی ناهمگن بزرگ به مجموعه کوچکتر و گروه های همگن تر نسبت به متغیر هدف (فیلد موردنظر). درختهای تصمیم روشی برای نمایش یک سری از قوانین هستند که منتهی به یک رده یا مقدار یا یک طبقه میشوند. برای مثال، میخواهیم متقاضیان وام را به دارندگان ریسک اعتبار خوب و بد تقسیم کنیم. شکل یک درخت تصمیم را که این مسئله را حل میکد نشان میدهد و همه مؤلفههای اساسی یک یک درخت تصمیم در آن نشان داده شده است : نود تصمیم، شاخهها و برگها درخت تصمیم برای موارد زیر به کار برده می شود. [9]
شکل1-2: نمونه یک درخت تصمیم
1-احتمال اینکه یک داده معلوم و معین متعلق به کدام دسته، را محاسبه می کند.
2-با اختصاص دادن آنها به دسته ای که احتمالش بیشتر است، رکوردها را دسته بندی می کند.
درخت تصمیم، براساس الگوریتم، ممکن است دو یا تعداد بیشتری شاخه داشته باشد. برای مثال، CART درختانی فقط با دو شاخه در هر نود ایجاد میکند. هر شاخه منجر به نود تصمیم دیگر یا یک نود برگ میشود. با پیمایش یک درخت تصمیم از ریشه به پایین به یک نمونه یک طبقه یا مقدار نسبت میدهیم. هر نود از ویژگی های یک نمونه برای تصمیمگیری درباره آن انشعاب استفاده میکند.
درختهای تصمیمی که برای پیشبینی متغیرهای دستهای استفاده میشوند، درختهای classification نامیده میشوند زیرا نمونهها را در دستهها یاردهها یا کلاس ها قرار میدهند. درختهای تصمیمی که برای پیشبینی متغیرهای پیوسته استفاده میشوند درختهای regression نامیده میشوند
جهت دریافت فایل بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005 پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان لطفا آن را خریداری نمایید
دسته بندی | کامپیوتر و IT |
بازدید ها | 0 |
فرمت فایل | doc |
حجم فایل | 1139 کیلو بایت |
تعداد صفحات فایل | 100 |
بانک اطلاعاتی
بخش 1 : مقدمه
1-1 مقدمه ای بر بانک اطلاعاتی
دادِگان (پایگاه دادهها یا بانک اطلاعاتی) به مجموعهای از اطلاعات با ساختار منظم و سامـانمند گـفته میشود. این پایگاههای اطلاعاتی معمولاً در قالبی که برای دستگاهها و رایانهها قابل خواندن و قابل دسترسـی باشند ذخیــــره میشوند. البته چنین شیوه ذخیرهسازی اطلاعات تنها روش موجود نیست و شیوههـای دیگری مانند ذخیرهســازی ساده در پروندهها نیز استفاده میگردد. مسئلهای که ذخیرهسازی دادههـا در دادگــان را موثر میســازد وجود یک ساختار مفهومی است برای ذخیرهسازی و روابط بین دادههااست.
پایگاه داده در اصل مجموعهای سازمان یافته از اطلاعات است.این واژه از دانش رایانه سرچشمه میگیرد ،اما کاربر وسیع و عمومی نیز دارد، این وسعت به اندازهای است که مرکز اروپایی پایگاه داده (که تعاریف خردمندانهای برای پایگاه داده ایجاد میکند) شامل تعاریف غیر الکترونیکـی برای پایگاه داده میباشـد. در این نوشـتار به کاربرد های تکنیکی برای این اصطلاح محدود میشود.
یک تعریف ممکـن این اسـت کـه: پایگـاه داده مجموعـهای از رکورد هـای ذخیره شـده در رایـانه بـا یک روش سیستماتیک (اصولی) مثل یک برنامه رایانهای است که میتواند به سوالات کاربر پاسخ دهد. برای ذخیره و بازیابی بهتر، هر رکورد معمولا به صـورت مجموعهای از اجـزای دادهای یا رویداد هـا سازماندهـی مـیگردد. بخش های بازیابی شده در هر پرسش به اطلاعاتی تبدیل میشود که برای اتخاذ یک تصمیـم کاربرد دارد. برنامـه رایانهای که برای مدیریت و پرسش و پاسخ بین پایگاههای دادهای استفاده میشود را مدیـر سیستم پایگاه دادهای یا به اختصار (DBMS) مینامیم. خصوصیات و طراحی سیستم های پایگاه دادهای در علم اطلاعات مطالعه میشود.
مفهوم اصلی پایگاه داده این است که پایگاه داده مجموعهای از رکورد ها یا تکه هایی از یک شناخت است.نوعا در یک پایگـاه داده توصیـف ساخـت یافتهای برای موجـودیت هـای نگـه داری شده در پایـگاه داده وجود دارد: این توصیف با یک الگو یا مدل شناخته میشود. مدل توصیفی، اشیا پایگاههای داده و ارتباط بین آنها را نشـان میدهد. روش های متفاوتی برای سازماندهی این مدل ها وجود دارد که به آنها مدل های پایگـاه داده گوییم. پرکاربردترین مدلی که امروزه بسیار استفاده میشود، مدل رابطهای است که به طـور عـام به صورت زیر تعریف میشود: نمایش تمام اطلاعاتی که به فرم جداول مرتبط که هریک از سطـر ها و ستونـها تشکیـل شده است (تعریف حقیقی آن در علم ریاضیات برسی میشود). در این مدل وابستگی ها بـه کمـک مقادیر مشترک در بیش از یک جدول نشان داده میشود. مدل های دیگری مثل مدل سلسلـه مراتب و مدل شبکهای به طور صریح تری ارتباط ها را نشان میدهند.
در مباحث تخصصی تر اصتلاح دادگان یا پایگاه داده به صورت مجموعـهای از رکـورد هـای مرتبط با هم تعریف میشود. بسیاری از حرفهای ها مجموعهای از داده هایی با خصوصیات یکسان به منظـور ایجـاد یک پایگاه دادهای یکتا استفاده میکنند.
معمولا DBMS ها بر اساس مدل هایی که استفاده میکنند تقسیم بنـدی میشونـد: ارتباطی،شی گـرا، شبکـهای و امثال آن. مدل هـای دادهای به تعیین زبانهای دسترسـی بـه پایگاههای داده علاقه مند هستند. بخش قابل توجهی از مهندسـی DBMS مستقـل از مـدل های میباشد و به فـاکتور هایی همچون اجرا، همزمانی،جامعیت و بازیافت از خطاهای سخت افزاری وابسطه است.در این سطح تفاوت های بسیاری بین محصولات وجود دارد.
موارد زیر به صورت خلاصه شرح داده می شود:
2-1 تاریخچه پایگاه داده
3-1 انواع دادگان ها
4-1 مدل های پایگاه داده
1-4-1 مدل تخت
2-4-1 مدل شبکه ای(Network)
3-4-1 مدل رابطه ای
4-4-1 پایگاه دادههای چند بعدی
5-4-1 پایگاه دادههای شیء
5-1 ویژگیهای سیستم مدیریت پایگاه دادهها
6-1 فهرست سیستمهای متداول مدیریت دادگان
2-1 تاریخچه پایگاه داده
اولیـن کاربردهـای اصطـلاح پایـگـاه داده بـه June 1963 بـاز مـیگردد، یعنـی زمـانی کــه شرکـت System Development Corporation مسئولیـت اجـرایـی یـک طـرح به نـام "توسعه و مدیریت محاسباتی یک پایگاه دادهای مرکزی" را بر عهده گرفت. پایگاه داده به عنوان یک واژه واحد در اوایل دهـه 70 در اروپا و در اواخر دهه 70 در خبر نامههای معتبر آمریکایی به کار رفـت.(بانـک دادهای یا Databank در اوایـل سـال 1966 در روزنامه واشنگتن کار رفت).
تصویر:اولین سیستم مدیریت پایگاه داده در دهه 60 گسترش یافت. از پیشگامـان این شاخه چارلز باخمن میباشد. مقالات باخمـن ایـن را نشـان داد که فرضیـات او کاربرد بسیار موثرتری برای دسترسی به وسایل ذخیره سازی را مهیـا میکنـد. در آن زمانهـا پردازش داده بر پایـه کـارت های منگنه و نوار هـای مغناطیسی بود که پردازش سری اطلاعات را مهیا میکند. دو نوع مدل دادهای در آن زمانهـا ایـجاد شـد:CODASYL موجب توسـعه مدل شبکهای شدکه ریشه در نظریات باخـمن داشت و مدل سلسله مراتبی که توسط North American Rockwell ایجاد شد و بعدا با اقباس از آن شرکت IBM محصولIMS را تولید نمود.
مدل رابطـهای توسـط E. F. Codd در سـال 1970 ارائه شد.او مدل های موجود را مـورد انتقاد قرار میداد. برای مدتـی نسبتا طـولانـی این مدل در مجـامع علـمی مـورد تایید بود. اولیـن محصـول موفق برای میکرو کامپیوتر ها dBASE بودکـه برای سیستـم عامـل هـایCP/M و PC-DOS/MS-DOS ساختـه شـد. در جـریان سال 1980 پژوهـش بر روی مـدل توزیع شده (distributed database) و ماشین های دادگانی (database machines) متمرکـز شد، امـا تاثیر کمـی بر بازار گـذاشت. در سال 1990 توجهات به طرف مدل شی گرا(object-oriented databases) جلـب شـد. این مـدل جـهت کنترل دادههـای مرکب لازم بود و به سادگی بر روی پایگاه دادههای خاص، مهندسی داده(شامل مهندسی نرم افزار منابع) و دادههای چند رسانهای کار میکرد.
در سال 2000 نوآوری تـازهای رخ داد و دادگـان اکسامال (XML) به وجـود آمد. هـدف ایـن مـدل از بین بردن تفاوت بین مستندات و داده هـا اسـت و کمـک میکند که منابع اطلاعاتی چه ساخت یافته باشند یا نه در کنار هم قرار گیرند
3-1 انواع دادگان ها
دادگانها از نظر ساختار مفهومی و شیوهای رفتار با دادهها بر دو نوع هستند :
1.دادگان رابطهای
2.دادگان شیگرا
4-1 مدل های پایگاه داده
شگـرد هـای مختلفـی برای مدل های دادهای وجود دارد. بیشتر سیستم های پایگاه دادهای هر چند که طور معمول بیشتر از یک مـدل را مورد حمایت قرار میدهند، حول یک مدل مشخص ایجاد شده اند. برای هر یک از الگوهای های منطقی (logical model) اجـراهای فیزیکی مختلفی قابل پیاده شدن است و سطوح کنترل مختلفی در انطباق فیزیکی برای کاربران محیا میکند. یک انتخـاب مـناسب تـاثیر مـثری بر اجرا دارد.مثـالی از موارد الگوی رابطهای (relational model) است: همـه رویـدادهای مهـم در مـدل رابطـهای امکان ایجاد نمایههایی که دسترسی سریع به سطرها در جدول را میدهد،فراهم میشود.
یک مـدل دادهای تنهـا شیـوه سـاختمان بـندی داده ها نیست بلکه معمولا به صورت مجموعهای از عملیات ها که میتوانـد روی داده هـا اجـرا شـود تعریـف مـیشوند. برای مثـال در مـدل رابطـهای عملیـاتی هـمچون گـزینش (selection)، طرح ریزی (projection) و اتصال (join) تعریف میگردد.
1-4-1 مدل تخت
مدل تخت یا جدولی (flat (or table) model ) تشـکیل شده اسـت از یـک آرایـه دو بعدی با عناصر دادهای که همه اجزای یک ستون به صورت دادههای مشابه فرض میشود و هـمه عناصـر یک سطـر با هم در ارتباط هستند. برای نمونه در ستون هایی که برای نام کـاربـری و رمـز عبور در جـزئی از سیستم های پایگاه دادهای امنیتی مورد استفاده قرار میگیرد هر سطر شـامل رمـز عبـوری اسـت که مخصوص یک کاربر خاص است. ستون های جدول که با آن در ارتباط هستند به صورت داده کاراکتری، اطـلاعات زمانـی، عـدد صـحیح یـا اعداد ممیز شناور تعریف میشوند. این مدل پایه برنامههای محاسباتی(spreadsheet) است.
پایـگاه داده هـا با فایـل هـای تـخت به سـادگی توسط فایل های متنی تعریف میشوند. هر رکورد یک خط است و فیلد ها به کمک جدا کننده هایی از هم مجزا میشوند. فرضا به مثال زیر دقت کنید:
id name team
1 Amy Blues
2 Bob Reds
3 Chuck Blues
4 Dick Blues
5 Ethel Reds
6 Fred Blues
7 Gilly Blues
8 Hank Reds
دادههای هر ستون مشابه هـم اسـت ما بـه این ستونهـا فیلـد ها (fields) گوییم. و هر خط را غیر از خط اول یک رکـورد(record) مـینامیم. خـط اول را که برخـی پـایگاههـای دادهای آنرا ندارند رکورد برچسب(field labels) گوییم. هر مقدار دادهای اندازه خاص خود را دارد که اگـر به آن اندازه نـرسـد مـیتوان از کاراکنر فاصله برای این منظور استفاده کرد اما این مسئله مخصوصا زمانی که بخواهیـم اطلاعـات را بـر روی کـارت های منگنه قرار دهیم مشکل ساز خواهد شد. امروزه معمولا از نویسه TAB برای جـداسـازی فیلـد ها و کـاراکتر خـط بعد برای رکورد بعدی استفاده میکنیم.
جهت دریافت فایل بانک اطلاعاتی لطفا آن را خریداری نمایید