سفارش تبلیغ
صبا ویژن

متن داده کاوی2

are now available for many relevant topics (e.g. Gene Ontology, Sequence Ontology,

Phenotype Ontologies etc.), it has not yet been proven what type of resources are

ideally suited for Text Mining solutions.

Investigating on the aims of research in Text Mining and in ontological design, we

find that ontologies are not designed to support Text Mining but rather to improve the

annotation of database content. Although, Text Mining solutions intend to fill databases

with content, it is not the case that Text Mining solution find ontological concepts

easily in the literature, and, even more, ontological resources are not designed

to support Text Mining solutions in the sense that the ontological terms fit to the demands

of a natural language processing system. However, the Text Mining community

exploits ontological resources to link generated evidence from the literature to

the ontological concepts. Furthermore, the ontologies are not only a tool, but also a

target for Text Mining research. Plenty of methods have been devised that automatically

or semi-automatically construct ontologies or enrich existing ontologies by extracting

terms and relationships from biomedical text collections.

These areas are researched by a community of researchers working in a highly interdisciplinary

way in the domains of biology, biochemistry, chemistry, medicine, machine

learning, formal ontologies, natural language processing, bioinformatics and

others. It was the aim for this seminar to bring together researchers from all those

areas to investigate on the state-of-the-art in both research fields, to discuss the suitability

and progress of available resources, to identify areas where we are lacking

tools, standards, or resources, and to foster joint opportunities for Text Mining and

ontological research for the benefits of life science research.

In preparation of the seminar and prior to the meeting, the organizers identified three

areas that best highlight the achievements and challenges in bringing together ontologies,


متن3

Text Mining, and biological research:

(1) exploring the benefits resulting from improved relations between Text Mining

and biological ontologies,

(2) technical advances in Text Mining and their application to life science research,

and,

(3) success stories of Text Mining solutions with and without ontological support.

The seminar brought together more than 40 internationally renowned researchers

from all domains mentioned beforehand. The ambience of the seminar is best described

with the concept of a prolonged, lively and heated discussion. The discussion

was mainly driven by the divergence of requirements, goals, and expectations between

the Text Mining and the ontology community. On the other side, a number of

talks have pointed out the successful integration of Text Mining solutions into research

in ontological design and the exploitation of ontological resources for successful

Text Mining solutions.

3 Ontologies for Text Mining – Text Mining for ontologies

One particularly important research question in this area is how terminological resources,

such as ontologies, can best support information retrieval (IR) and information

extraction (IE) solutions and vice versa. In theory we can expect that large terminological

resources cover well the domain knowledge and efficiently contribute to one

Dagstuhl seminar proposal „ Ontologies and Text Mining for Life Science“ 3/5

basic information extraction step, i.e. to named entity recognition (NER), in both IR

and IE. In reality, conceptual resources such as ontologies form poor terminological

resources since they have never been designed to serve this purpose

متن انگلیسی داده کاوی(مقاله)

Dagstuhl seminar proposal „ Ontologies and Text Mining for Life Science“ 1/5

Ontologies and Text Mining for Life Sciences

Current Status and Future Perspectives

Dagstuhl, 25-28 March 2008

Executive Summary

Keywords: Text Mining, natural language processing, ontologies, ontology design,

machine learning, bioinformatics, medical informatics, knowledge management

1 Introduction

Researchers in Text Mining and researchers active in developing ontological resources

provide solutions to preserve semantic information properly, i.e. in ontologies

and/or fact databases. Researchers from both fields tend to work independently from

each other, but there is a shared interest to profit from ongoing research in the complementary

domain. The relatedness of both domains has led to the idea to organize

a workshop that brings together members of both research domains.

2 The gap between Text Mining and ontologies

Life Science researchers deliver their findings in scientific publications. These documents

are nowadays distributed electronically and increasingly processed by automatic

means to also incorporate those findings and the data into structured, scientific

databases. Methods for this purpose are generally subsumed under the term “Text

Mining”, encompassing techniques belonging to the fields of machine learning, information

retrieval and natural language processing. Text Mining-based solutions have,

for instance, been developed for the identification of protein-protein interactions, of

gene regulatory events, for the functional annotation of proteins, for the identification

and prioritization of disease-related genes, and for the analysis of results from highthroughput

experiments.

Text Mining for the Life Sciences has received considerable interest over the last

years and is now an established area for conferences and workshops (e.g., ISMB,

KDD, ECCB, Coling, ACL, PSB) and has lead to international large-scale challenge

events (KDD-Cup, Genomics track at TREC, BioCreative2&2, BioNLP). The cause

for this interest is the ever increasing amount of publications imposing an unbearable

work burden on the individual researcher and the promising advances in natural language

processing and machine learning that form the solution to the problem, if they

are integrated into biomedical applications.

Text Mining has to cope with a large semantic gap between the raw textual data and

the representation of meaningful results in databases, e.g., normalization of events in

the text to conceptual representations of events according to “textbook” knowledge. It

is hoped that ontologies fill this gap delivering a structured representation of biomedical

knowledge. Although large and increasingly comprehensive biological ontologies


بازارهای هفتگی

بازار:

عبارت است ازمحلی برای مبادله کالا,جایی که یک فروشنده ویک خریداروجوددارد ,می توانیم بگوییم بازاروجوددارد,اما اندازه بازارراقیمت تعیین می کند.یعنی باکاهش قیمت یک محصول خاص,تعدادافرادی که می توانندآن رابخرندافزایش می یابد,یعنی بازاربزرگتر می شود وهمچنین برعکس.

بازارمکان تجاری است که هدفش تامین نیازمردم است یعنی عرضه ی کالا وخدمات به مردم,دربازاررقابت مستقیم وغیرمستقیم وجوددارد.اجناس موجوددربازاربراساس تمایلات,ذائقه ها وعادت های خریداراست.به غیرازتامین نیازمردم هدف دیگربازار پیشرفت درکسب وکاروحضورهدفمندوموفق درعرصه جهانی است.رمزپیروزی درعرصه جهانی افزایش توان رقابت پذیری وبهره وری است که بابرخورداری ازبخش خصوصی توانمد وکارآمدومدیریت روشمندبه موفقیت بازارجهانی بدست می یابد.

 

به طورخاصه اندازه بازار به تعداد افرادی بستگی داردکه:

 

1-    به محصول موردنظرعلاقه مندند.

 

2-   حاضرند منابع لازم رابرای بدست آوردن محصول مبادله کنند,هرگاه امکان بالقوه دادوستدموجودباشد,بازارنیزوجوددارد.

 

انواع بازار عبارتست از:

بازار نفت,بازارکشاورزی,بازاربورس,بازارارزوبازارهایی که مردم عادی باآن سرو کار دارندبازارهای محلی ,هفتگی وبازارهای روزانه.

 

 

فرضیه ها: ********************************

فرضیه(1): آیامصرف کننده به دلیل قیمت مناسب ازبازارهفتگی استفاده می کنند.

فرضیه(2): آیامصرف کننده به دلیل کیفیت خوب کالاهاازبازارهفتگی خریدمی کنند.

فرضیه(3): آیاخریدازبازارهفتگی برای مصرف کننده ,براثرعوامل اجتماعی ,فرهنگی وگروهی است.

                           **********************

مصرف کننده ها:

مصرف کننده هدف نهایی بازاراست.بهمین جهت بازارعمیقا:بامصرفکننده ارتباط دارد.زیرااساسا" بازاریعنی مصرف کننده که بدون آن هاجریان عظیم کالا وخدمات که عامل اصلی تجارت است,وجودندارد.

مصرف کننده سلطان بازاراست.چراکه درمقابلکالاهای متنوع ومختلفی قرارمی گیردواوست که بایدبه میل خودانتخاب کند.

مصرف کننده دارای خصوصیاتی ازقبیل:

سن: کودک,نوجوان,جوان,ومسن.

شخصیت:اجتماعی,منزوی,برون گرا,درون گرا,مستبد,جاه طلب و.... .

درآمد: طبقه پایین ,متوسط وبالا.

عقاید .مذهب : اسلام ,زرتشتی,مسیحی و ... .

شغل: کارگز,زارع,مهندس,پزشک, و.. .

تحصیل: بی سواد,فارغ التحصیل,دبیرستان یادانشگاه.

موقعیت اجتماعی:معتبر,ممتاز,پایین و... .

سکونت: شهری,روستایی,حومه نشین.

جنسیت: زن,مرد.

خصوصیات مصرف کنندگان معمولا" آنقدرزیادومتغییراست که گروه بندی آن ها ازنظرعکس العمل در مراحل اصلی تعیین بازار بسیار مشکل است.بهمین جهت درهرجامعه تقسیم بندی بازار که یکی از مراحل اصلی تعیین بازارهدف براساس خصوصیات وویژگی های مصرف کننده وعوامل محیطی است بسیارمشکل وخاص همان جامعه است.

اثبات متنی فرضیه اول:

تعریف بازارهفتگی:

قیمت حساسترین عنصرآمیخته بازارعبارتست ازمبالغی که مشتریان درقبال تحویل گرفتن محصول پرداخت می کنندوشامل مباحثی نظیرتخفیف,لیست,قیمت,اعتبارات وشرایط آن می باشد.

بازارهای هفتگی دارای لیست قیمت است که توسط شهرداری تعریف شده است .مصرف کننده هابرحسب درآمدوثروتش ازکالا هااستفاده می کنند.البته قابل ذکراست وصرف کنده های بازارهفتگی بیشترقشرپایین جامعه می باشندکه درآمدچندانی ندارندوقیمت کالاها برای آن ها مناسب است.

 

 

*********

اثبات فرضیه دوم:

درنگرشی سنتی محصولات درپرتوویژگیهاوصفات فیزیکی آن ازقبیل استحکام وقابل اعتماد بودن ارزیابی می شودولی امروزه مطلوبترین وموفق ترین محصول, اگرنیازها,خواسته ها,انتظارات مشتریان رابرآورده نسازداید ئال محسوب نمی شود.

مشتریان به ماکمک می کنندتامناسب بودن راشناسایی کنیم وتنها کاری که بایددراین خصوص انجام دهیم این است که ازآنان نظرخواهی کنیم.

دربازارهای هفتگی تره بارومیوه جات به علت بومی بودن محصولات کشاورزی وباغی دارای کیفی بالایی است .

همچنین محصولات دیگرکه ازکارخانه های معتبر بومی وبدون واسطه دربازارهفتگی به فروش می رسددارای کیفیت واستانداردبالایی است .

کالاهای سنتی بومی که دارای کیفیت بالا هستند به فروش می رسندواجناسی که ازکشورهمسایه مان دارای استانداردبین الملی وکیفیت بالا هستند عرضه می شوند.

 

 

**********

 

اثبات فرضیه سوم:

افکار,اعمال وباورهای ماعمدتا" تحت تاثیرعوامل ونیروهای فرهنگی _اجتماعی وگروهی تعیین می شود.فرآیندتصمیم گیری خرید نیزازاین عوامل تاثیرمی پذیرد.

این نیروهاوعوامل عبارتنداز:

تاثیرات فرهنگی:

فرهنگ عبارت است ازمجموعه ای ازنمادهای ملموس (ابزار,مسکن,محصولات وکارهای هنری) وناملموس(مانندتلفیقات,باورها,ارزشهاوزیان)نهادهاوروشهادریک جامعه که ازنسلی به نسل دیگرمنتقل می شودودرطول زمان تغییرمی یابد.

 

تاثیرات طبقه اجتماعی:

 عوامل تعیین کننده طبقات اجتماعی مانندثروت ,درآمد, تحصیلات ,مدرک ووابستگی های فامیلی ومحلی درجوامع مختلف یکسان نیس ودرطی زمان تغییرمی کنندوباتوجه به نوع طبقات ,نیازهاوخواسته هانیزتغییر می کند.

 

تاثیرات گروههای مرجع:

گروههای مرجع کسانی هستندکه به نحوی برارزشها,تلقیات ورفتاردیگران اثرمی گذارد.

یکی ازپدیده هایی که درخریدمردم منطقه هاموردمطالعه قرارگرفته پدیده "چشم همچشمی" است که ازآثار گروههای مرجع به حساب می آید.دربازارهفتگی صنایع هنری ودستی بومی که دارای باور وارزش خاصی است عرضه می شود ,طبقات اجتماعی پایین ومتوسط جامعه بیشترازبازارهفتگی خرید می کنندهم به علت قیمت مناسب ,هم آسودگی وراحتی چون خریدیک هفته خودرادریک مکان انجام می دهند.

 

 

مشکلات بازارهای هفتگی

 

بازارهای هفتگی رادربعضی مناطق دورازشهروروستاقرارمی دهندکه مشکل حمل ونقل نامناسب برای رفتن به بازاروجوددارد,یادرمناطق شلوغ وپررفت آمدکه باعث اخلال درزندگی روزانه مردم می شود.وضعیت آب وهوایی گاهی به ضرربازارهفتگی است چون بازارهفتگی روبازاست باران وبرف مشکل ایجادمی کند.

باورهای غلط مردم خدپنداری ها,نحوه نگرش مردم نسبت به خودوتصویری که فکرمی کنددیگران ازاوداردکه ریشه درشخصیت فرداست با تلقیات وبرداشت های اشتباه مردم نسبت به خریدازبازارهفتگی بروزمی دهند.

بحث دیگرازنظرامنیتی است به علت وجودتمام قشرهابازارکیف قاپی رونق گرفته بهمین علت نیروی انتظامی باید همکاری بیشتری باشهرداری درزمینه کنترل امنیت بازارهفتگی داشته باشد.


داده کاوی5

5– راه حل های موفق کاوشگری

راه حل هی متن کاوی, متن رابرای فعال کردن دسترسی بهتر,برای بدست آوردن نتایج خوب تعریف شده,برای کاهش محتوای به بخش های مربوط ودرآخر,برای کاهش مقدار خواندن به عنوان سوداصلی کاربرانش ,پردازش می کند. هنوز این مسئله حل نشده است که آیا راه حل های کاوشگری وجودداردکه یابهبودهاراپشتیبانی می کندوداگرموردتوجه قرارندهد,مانع قابلیت استفاده خواهد شد. انواع داده درکتاب هاوادبیات وانواع مدارک ,موجوداست.روش های مختلف برای پردازش اطلاعات,طراحی میانجی (فاصل),ارتباط بامنابع دیگروغیره راجستجو می کند. ازطرف دیگر,هرراه حل موفق کاوشگری ,شامل اصول طراحی می شود که کمک به درک چگونگی منابع اصطلاح شناسی وپروفیل های کاربروانتظارات متناسب باهم ,دارد. بنابرین,سومین روز,مذاکراتی برموادارائه شده ومشکلات سیستم های کاوشگری دردوره کاری هرروزشامل می شودکه بصورت مفصل توسط جودیت بلیک(آزمایشگاه جکسون )توضیح داده می شد.که با استفاده ازتجربه هایی ازبانک اطلاعاتی Mouse Genome به عنوان نمونه شامل طبقه بندی مربوط ,مسیریابی براساس موضوع واستخراج اطلاعات. آنا دیولی(دانشگاه شیکاکو,ایالات متحده آمریکا )نتایجی ازدونظرسنجی کاربرارائه کرده که درارتباط باپروژه BioText به منظور کشف درمورد اولویت درطراحی رابط های کاربر برای کاربران بیولوژیکی ,انجام می شود. توافق کلی وجودداشت که برای حفظ کاربران نهایی که درمرحله توسعه شامل می شدند,مهم است.HM موبر,اصول طراحی متنPresso راکهتوسط حداقل 20سیستم کاری درسراسر دنیا مورد استفاده می شده ,راارائه داد.جورج هاکنبرگ ومارتین کرالینگر(CNIO ,مادرید,اسپانیا) درمرد پیشرفت متاسرویس برای ابزارهای کاوشگری گزارش کرده اند که از رقابت دومین Biocreative ناشی می شودکه به عنوان داشتن پتانسیلی ازتاثیر زیاددراین زمینه ,باارائه دسترسی به راه حل های پیشرفته کاوشگری,اذعان می کند. خدماتی همچنین کانون ارائه از Dietrich Rebholz _schumann ,بودکه برابزارهای کاوشگری درموسسه بیوانفورماتیک اروپایی تاکید می کند. ابزارهای تجاری توسط مایکل شرودر و دیوید میلوارد ارائه می شود. مثالی برای برنامه های بسیار ابتکاری کاوشگری رانیکل کولیرنشان می دهد(دانشگاه توکیو, JP ) : جمع آوری سیستم  Biocastor وتجزیه وتحلیل اخباربرای ارتباط شان به منظور نشان دادن شیوع بیماری است. بنابراین ,ساخت یک هشدار اولیه یا سیستم درنظارت شایعه".

6 پژِوهش دردست اقدام درپیشرفت منابع فنوتایپ

موضوع مطرح شده دردوره سمینار,تقاضای روبه افزایش واهمیت مدیریت ,ارائه وادغام سخنرانی های مفهومی ازفنوتایپ می باشد.به عنوان یک اقدام فوری,کارشناس حاضردراین موضوع,برروی پیشرفت وکاردردست اقدام دراین حوزه گزارش کرده اند.

جودیت بلیک (آزمایشگاه جکسون,مین,ایالات متحده آمریکا)پژوهشی دردست اقدام رادر طراحی وتوسعه هستی شناسی بود که توسط الف سروهمکارانش به منظور پی بردن به پیش بینی های عملکردی پروتئینی ازطریق پروفیل های مفهومی متشکل ازویژگی های فنوتایپی ,را استفاده شد.

سوزان لوئیس ,درمورد توسعه سازمان Phenote که یک منبع جدیدی برای توصیف اطلاعات فنوتایپی بافرمت داده ای بسیار کلی است,راگزارش داد. این فرمت,تمام بازنمودها را کاهش می دهدکه توسط مفهوم هستی شناسی انتخاب شده هایی ازهستی شناسی خاص راتشکیل شده اند ویک شیوه ای است که هستی شناسی موجودبرای هدف جدیدتاثیر خوبی دارد.

درپایان, رابرت هوندورف ,پیامدهای منطقی ارائه فنئتایپ هارا به عنوان مشتقاتی ازبین نوع را نشان داد که برای استفاده از non_monotonic یامنطق پیش فرض می باشد.

7 نتیجه گیری

این سمینار ,محققانی ازرشته های مختلف تحقیقاتی را گردهم آورده است که مربوط به کاوشگری وهستی شناسی درعلوم زیستی می شودوبه آنها طراحی داد تادیدگاههای متفاوت ومشترک خودرا به بحث گذارند. روشن شد که می توان تحقیق مشارکتی بهتری راارائه دادکه شیوه های چندرشته ای باید نتایج بهتری رانسبت به تحقیقی محدود به یک حوزه راباید ارائه داد.اما چنین تحقیق مشارکتی اول ازهمه ,هزینه هاراافزایش می دهد واحتمالا" برای حفظ آن آسان نیست.

آن نیز واضع می شودکه مشکلاتی مربوط به کارمشارکتی وجودداردکه مربوط به تفاوت های اجتماعی یافرهنگی درکارتحقیقی می شود.

مثل سوا لی ازکجاوچگونه دوره های شغلی فردی راحفظ کرد. علاوه براین, یافتن بودجه تحقیقاتی برای سیستم های توسعه یافته ی دقیق توسط زیست شناسان,آماده برای استفاده است.

به جای حمایت ازنمونه های اصلی تحقیقاتی "فقط" انتشارآن دشواراست.

این وضعیت ناشی ازشیوه های بسیارجالب است که هیچ گاه برای برنامه های واقعی زندگی دردسترس نیست.به هرحال ,شرکت کنندگان به روشنی اذعان کردندکه سمینارهایی ازاین قبیل ,دقیقا" راه درست غلبه برمشکلات راارئه می دهند.