DeepMind AI تاشو پروتئین را کنترل می کند ، که باعث آرامش نرم افزار قبلی می شود


بزرگنمایی / پروتئین ها به سرعت ساختارهای پیچیده ای را تشکیل می دهند که پیش بینی آنها دشوار است.

امروز ، DeepMind اعلام کرد که به ظاهر یکی از مهمترین مشکلات بیولوژیکی را حل کرده است: این که چگونه رشته اسیدهای آمینه در یک پروتئین به شکل سه بعدی جمع می شود که عملکردهای پیچیده آنها را امکان پذیر می کند. این یک چالش محاسباتی است که علی رغم استفاده از سخت افزار سطح فوق رایانه برای این محاسبات ، طی دهه ها در مقابل تلاش بسیاری از زیست شناسان بسیار باهوش مقاومت کرده است. در عوض ، DeepMind طی چند هفته سیستم خود را با استفاده از 128 پردازنده تخصصی آموزش می دهد. اکنون ظرف چند روز ساختارهای بالقوه را برمی گرداند.

محدودیت های این سیستم هنوز نامشخص است – DeepMind می گوید که در حال حاضر در حال برنامه ریزی یک مقاله بررسی شده است و فقط یک پست وبلاگ و برخی اطلاعیه های مطبوعاتی منتشر کرده است. اما این سیستم با داشتن بیش از دو برابر کارایی بهترین سیستم در طی چهار سال ، عملکرد بهتری نسبت به هر آنچه که پیش از آن بوده است ، انجام می دهد. حتی اگر در همه شرایط مفید نباشد ، پیشرفت احتمالاً به این معنی است که اکنون ساختار پروتئین های بسیاری از چیزی غیر از توالی DNA ژن کد کننده آنها قابل پیش بینی نیست ، که این یک تغییر عمده در زیست شناسی را نشان می دهد.

بین چین ها

برای ساخت پروتئین ، سلولهای ما (و سلولهای موجود دیگر) از طریق شیمیایی اسیدهای آمینه را به هم متصل کرده و زنجیره ای تشکیل می دهند. این نتیجه می دهد زیرا هر اسید آمینه ستون فقرات مشترکی دارد که می تواند از لحاظ شیمیایی به هم پیوندد و یک پلیمر تشکیل دهد. اما هر یک از 20 آمینو اسید مورد استفاده در زندگی ، مجموعه ای جداگانه از اتم ها به آن ستون فقرات متصل است. آنها می توانند شارژ یا خنثی ، اسیدی یا اساسی و غیره باشند و این خصوصیات نحوه تعامل هر اسید آمینه با همسایگان و محیط را تعیین می کند.

فعل و انفعالات این اسیدهای آمینه ساختار سه بعدی را تعیین می کند که زنجیره پس از تولید به خود می گیرد. اسیدهای آمینه آبگریز برای جلوگیری از محیط زیست در داخل ساختار قرار می گیرند. آمینو اسیدهای مثبت و دارای بار منفی به یکدیگر جذب می شوند. پیوندهای هیدروژنی باعث تشکیل مارپیچ های منظم یا ورق های موازی می شوند. با هم ، آنها زنجیره ای را مختل می کنند که در یک ساختار مرتب قرار می گیرد. و این ساختار مرتب شده به نوبه خود رفتار پروتئین را تعیین می کند ، به او اجازه می دهد مانند کاتالیزور عمل کند ، به DNA متصل شود یا انقباض عضله را تحریک کند.

تعیین ترتیب اسیدهای آمینه در یک زنجیره پروتئینی نسبتاً آسان است. آنها به ترتیب بازهای DNA در ژن رمزگذار پروتئین تعیین می شوند. و از آنجا که در تعیین توالی کل ژنوم ها بسیار ماهرانه عمل کرده ایم ، تعداد زیادی توالی ژنی و در نتیجه مازاد عظیمی از توالی های پروتئینی اکنون در دسترس ما است. اما برای بسیاری از آنها ، ما هیچ تصوری از پروتئین خورده نداریم که تعیین نحوه کار آن را دشوار می کند.

با توجه به اینکه ستون فقرات یک پروتئین بسیار انعطاف پذیر است ، تقریباً هر دو اسید آمینه موجود در یک پروتئین می توانند به طور بالقوه با یکدیگر تعامل داشته باشند. بنابراین ، درک اینکه چه کسی در واقع در پروتئین تا شده برهمکنش می کند و چگونه این انرژی آزاد از پیکربندی نهایی را به حداقل می رساند ، به محض اینکه تعداد اسیدهای آمینه بیش از حد زیاد شود ، یک چالش محاسباتی نامحلول می شود. در حقیقت ، وقتی هر اسید آمینه بتواند مختصات بالقوه موجود در فضای سه بعدی را اشغال کند ، کشف اینکه چه چیزی قرار گیرد واقعاً دشوار است.

با وجود دشواری ها ، از جمله در محاسبات توزیع شده و گیمیفیکیشن تاشو ، پیشرفت هایی صورت گرفته است. اما یک رویداد دو ساله در حال انجام به نام ارزیابی انتقادی پیش بینی ساختار پروتئین (CASP) پیشرفت کاملاً نامنظمی را در طول وجود خود مشاهده کرده است. و در صورت عدم وجود یک الگوریتم موفق ، انسان با مشکل دشوار تصفیه پروتئین روبرو می شود ، سپس با استفاده از پراش اشعه X یا میکروسکوپ الکترونی برقی می تواند ساختار شکل خالص را درک کند ، تلاش هایی که اغلب ممکن است سالها به طول انجامد.

DeepMind وارد نبرد می شود

DeepMind یک شرکت هوش مصنوعی است که در سال 2014 توسط گوگل خریداری شد. از آن زمان ، چندین اسپری ایجاد کرده است ، سیستم هایی را توسعه می دهد که مردم را با موفقیت به Go ، Chess و حتی می برد هنر و صنعت ستاره. این سیستم در چندین موفقیت چشمگیر خود ، قبل از اینکه آن را برای تنها بازی بگذارد ، با تهیه قوانین بازی به آن آموزش داده شد.

اگرچه این سیستم فوق العاده قدرتمند است ، اما مشخص نیست که برای جمع آوری پروتئین ها کار خواهد کرد. اولاً ، هیچ استاندارد بیرونی واضحی برای “پیروزی” وجود ندارد – اگر ساختاری با انرژی بسیار کم داشته باشید ، تضمین نمی کند که چیزی کمی پایین تر وجود داشته باشد. علاوه بر این ، موانع زیادی در برابر قوانین وجود ندارد. بله ، اسیدهای آمینه با بارهای مخالف اگر در کنار یکدیگر باشند ، انرژی آزاد را کاهش می دهند. اما وقتی صحبت از دهها پیوند هیدروژنی و آمینو اسیدهای آبگریز از آب خارج شود ، این اتفاق نخواهد افتاد.

بنابراین چگونه می توانید هوش مصنوعی را در این شرایط وفق دهید؟ تیم DeepMind برای الگوریتم جدید خود ، AlphaFold نامیده می شود ، پروتئین را به عنوان یک نمودار فضایی از شبکه ، با هر اسید آمینه که یک گره است ، درمان می کند و اتصالات بین آنها به دلیل مجاورت با پروتئین خورده واسطه است. سپس هوش مصنوعی خود در زمینه درک پیکربندی و قدرت این پیوندها با تهیه ساختارهای از پیش تعریف شده بیش از 170،000 پروتئین مشتق شده از یک پایگاه داده عمومی ، آموزش می یابد.

وقتی پروتئین جدیدی داده می شود ، AlphaFold تمام پروتئین ها را با یک توالی مرتبط جستجو می کند و قسمتهای مربوط به توالی ها را تراز می کند. وی همچنین به دنبال پروتئین هایی با ساختارهای شناخته شده است که دارای مناطق شباهت نیز باشند. معمولاً این رویکردها برای بهینه سازی خصوصیات محلی ساختار عالی هستند ، اما برای پیش بینی ساختار کلی پروتئین چندان مناسب نیستند – صاف کردن یک قطعه کاملاً بهینه شده لزوماً منجر به یک کل بهینه نمی شود. در اینجا نیز ، بخشی از الگوریتم یادگیری عمیق مبتنی بر توجه برای اطمینان از سازگاری ساختار کلی استفاده می شود.

موفقیت واضح ، اما با محدودیت

برای CASP امسال ، AlphaFold و الگوریتم های دیگر شرکت کنندگان از مجموعه ای از پروتئین ها آزاد شدند که یا هنوز حل نشده بودند (و تا زمان ادامه چالش حل نشده بودند) ، یا حل شدند اما هنوز منتشر نشده اند. بنابراین ، هیچ راهی برای سازندگان الگوریتم ها نبود تا بتوانند سیستم ها را با اطلاعات دنیای واقعی آماده کنند و نتیجه الگوریتم ها را می توان به عنوان بخشی از چالش با بهترین داده های واقعی مقایسه کرد.

AlphaFold بسیار خوب عمل کرد – در واقع بسیار بهتر از هر رکورد دیگر. برای حدود دو سوم پروتئین هایی که برای آنها ساختار ایجاد کرده است ، اگر بخواهید مطالعات ساختاری را در آزمایشگاه تکرار کنید ، این خطای آزمایشی را خواهید داشت. به طور کلی ، هنگام تخمین دقت ، که از صفر تا 100 است ، میانگین آن 92 است – باز هم ، نوعی از دامنه را خواهید دید که اگر بخواهید ساختار را دو بار تحت دو شرایط مختلف بدست آورید.

با هر استاندارد منطقی ، چالش رایانه ای در ایجاد ساختار پروتئین حل می شود.

متأسفانه ، پروتئین های نامعقول زیادی در آنجا وجود دارد. برخی بلافاصله در غشا فرو می روند. دیگران به سرعت تغییرات شیمیایی را انجام می دهند. برخی دیگر نیاز به فعل و انفعالات گسترده با آنزیم های تخصصی دارند که انرژی را می سوزانند تا پروتئین های دیگر را وادار به جمع کنند. بعید به نظر می رسد که AlphaFold بتواند از پس همه این موارد شدید برآید و بدون مقاله دانشگاهی که سیستم را توصیف می کند ، برای درک محدودیت های سیستم مدتی طول می کشد – و برخی از آنها در دنیای واقعی استفاده می شود. این نباید از یک دستاورد باورنکردنی گرفته شود ، بلکه فقط باید در مورد انتظارات بی دلیل هشدار داده شود.

اکنون س keyال اصلی این است که سیستم با چه سرعتی در دسترس جامعه تحقیقات بیولوژیکی قرار می گیرد تا بتوان محدودیت های آن را تعریف کرد و ما می توانیم از آن در مواردی که احتمالاً خوب کار می کند و ارزش قابل توجهی دارد مانند ساختار استفاده کنیم. پروتئین از پاتوژن ها یا اشکال جهش یافته موجود در سلول های سرطانی –


منبع: khabar-tak.ir

دیدگاهتان را بنویسید

Comment
Name*
Mail*
Website*