A A A A Автор Тема: Космологические и комбинаторные основания редкости жизни в наблюдаемой вселенной  (Прочитано 144307 раз)

0 Пользователей и 2 Гостей просматривают эту тему.

Оффлайн Combinator

  • *****
  • Сообщений: 2 628
  • Благодарностей: 88
    • Сообщения от Combinator
Интересен ваш коментар насчет статьи "PALEONTOLOGICAL TESTS: HUMAN-LIKE INTELLIGENCE IS NOT A CONVERGENT FEATURE OF EVOLUTION", ссылку к которой привел Asket.

В выходные погляжу...

Оффлайн Combinator

  • *****
  • Сообщений: 2 628
  • Благодарностей: 88
    • Сообщения от Combinator
Это главный камень преткновения, в том числе и с автором темы и Мазуром. Это ниоткуда не следует. Впрочем, dzver уже опередил меня.

Для меня, как программиста, практика важнее сухой теории. На практике эта формула вполне успешно работает, а по поводу философских интерпретаций этого факта пусть спорят специалисты по теорверу и теории нечётких множеств...



Оффлайн dzver

  • *****
  • Сообщений: 2 899
  • Благодарностей: 61
    • Сообщения от dzver
Возьмем все существующие на данный момент виды. Это будет срез филогенетического дерева (точнее сети) всех когда-либо существовавших видов.
Этого я не понял...  Это будет - срез филогенетической сети существующих на данных момент видов - уже по определению (то, что некоторые из них возможно не изменились - другой вопрос - но они вписаны в текущей сети, как и все остальные)
Теперь сделаем тоже самое для момента 100 млн. лет назад – получим свою сеть, шагнем еще на 100 млн. лет назад и т.д. Размер сети, т.е. количество вершин – разнообразие видов организмов будет разным. Также в каждой сети будут отличатся длинны пищевых цепочек и возможные горизонтальные связи между видами.
Я пока не уверен, что современный этап соответствует максимальной сложности биосферы по этому критерию. Возможно во времена динозавров или кембрийского взрыва, биосфера была богаче и сложнее. Естественно учитываются существовавшие на тот момент виды, в т.ч. ныне вымершие. Соответственно, если средняя (или крайние) длины ДНК с того времени мало изменилась или выросли, использовать длину ДНК, как критерий сложности ошибочно.
В лучшем случае, следует искать зависимость между структурой ДНК существующих видов и структурой биосферной сети. Т.е. критерием сложности является не длинна ДНК, а ее вариабельность. Проще говоря, на последовательности из 10 элементов может быть записано больше информации, чем на последовательности из 100 элементов, если последняя сжимается меньшим алгоритмом, чем первая.
Понятно. Вы предлагаете искать корреляцию, типа: сложнее сеть<->м.геном длиннее; проще сеть<->м.геном меньше.
Почему-то мне (с потолка) кажется, что явной такой корреляции не будет...
В связи с этом, можно подумать - при массовых катаклизмов - например при гибели динозавров - сеть должна быть "резко" упроститься - сокращался ли м.геном остальных видов в это время, чтобы освободиться от "лишнего информационного балласта" связанного с необходимости выживания в более сложной сети при наличии динозавров?
Почему то кажется что такой связи не будет.. (но такое - наверное возможно более-менее определить как-нибудь из наличных данных).
Наверное - однако логично такой связи быть м.генома тем организмам которые находятся выше в энергетической/пищевой пирамиде - со сложности сети уровня видов непосредственно ниже (горизонтальный уровень тех, некоторых из которых они "питаются")... Типа м.геном волка зависит от сложности сети уровня зайцев... Наверное и наоборот, т.е. уровня выше. Гм.

Про "может быть записано больше информации" - это как посмотреть... Зависит ведь от контекста в котором эта последовательность развертывается.
Что является носителем большего количества информации - формулировка теоремы Ферма, или одноминутный белый шум дискретизованный 22кHz... Все тут мутно.
« Последнее редактирование: 19 Апр 2013 [19:27:22] от dzver »

Оффлайн dzver

  • *****
  • Сообщений: 2 899
  • Благодарностей: 61
    • Сообщения от dzver
На практике эта формула вполне успешно работает, а по поводу философских интерпретаций этого факта пусть спорят специалисты по теорверу и теории нечётких множеств...
Даже шутка насчет этого есть:
"- Какова вероятность встретить розового слона?
- Ну 50% - можно встретить, а можно и не встретить..."

Оффлайн Combinator

  • *****
  • Сообщений: 2 628
  • Благодарностей: 88
    • Сообщения от Combinator
Даже шутка насчет этого есть:
"- Какова вероятность встретить розового слона?
- Ну 50% - можно встретить, а можно и не встретить..."

Не забываем, что формула Лапаласа применима только тогда, когда у нас отсутствует априорная информация...


Оффлайн dzver

  • *****
  • Сообщений: 2 899
  • Благодарностей: 61
    • Сообщения от dzver
Цитата: dzver от Сегодня в 19:22:19
Цитата
    Даже шутка насчет этого есть:
    "- Какова вероятность встретить розового слона?
    - Ну 50% - можно встретить, а можно и не встретить..."
Не забываем, что формула Лапаласа применима только тогда, когда у нас отсутствует априорная информация...
Это последнее сообщение в связи с вероятностей, т.к. мне надоело.
Вот именно - шутка-то в том, что тот, кто так ответил - и НЕ ЗНАЛ априори ничего про вероятности или невероятности встречи розовых слонов.... Вот и воспользовался вашим подходом равных вероятностей... Прав ли он что вероятность 50% - сработал ли ваш подход на практике (что можно независимо проверить - потом статистикой)?

Оффлайн Combinator

  • *****
  • Сообщений: 2 628
  • Благодарностей: 88
    • Сообщения от Combinator
Вот именно - шутка-то в том, что тот, кто так ответил - и НЕ ЗНАЛ априори ничего про вероятности или невероятности встречи розовых слонов.... Вот и воспользовался вашим подходом равных вероятностей... Прав ли он что вероятность 50% - сработал ли ваш подход на практике (что можно независимо проверить - потом статистикой)?

Если человек никогда в жизни не видел слонов, то его ответ абсолютно верный. Вот вам другой пример. Какова вероятность того, что завтра в Ваш дом угодит метеорит? Исходя из строго научного байесовского подхода Вы должны ответить - не знаю. А я знаю, в соответствии с формулой Лапласа она очень близка к нулю. Какой ответ более правильный, каждый решает для себя сам...


Оффлайн vika vorobyeva

  • ASTRONOMY.RU
  • *****
  • Сообщений: 9 310
  • Благодарностей: 821
    • Сообщения от vika vorobyeva
    • Записки Вики Воробьевой
Кстати, по поводу панспермии.
Сегодня запустили спутник "Бион-1М", на котором помимо монгольских песчанок, гекконов и прочей живности в космос полетят "искусственные метеориты" (базальтовые пластины с микробами внутри). Причем если песчанки и гекконы будут внутри спутника, то "метеориты" - снаружи. Месяц они проведут в условиях открытого космоса, а потом "сядут" вместе со спутником на Землю, по дороге подвергнувшись всем прелестям спуска через атмосферу.
http://ria.ru/science/20130419/933515793.html

Нулевая экспериментальная проверка теории панспермии :) Если какие-нибудь микробы выживут - можно будет запускать такие "искусственные метеориты" повыше и держать их в космосе подольше.
я не заметила момента
когда мой замок из песка
стал превращаться в криворожский
железорудный комбинат

Оффлайн Patsak

  • ****
  • Сообщений: 422
  • Благодарностей: 20
  • Ку
    • Сообщения от Patsak
Этого я не понял...  Это будет - срез филогенетической сети существующих на данных момент видов - уже по определению (то, что некоторые из них возможно не изменились - другой вопрос - но они вписаны в текущей сети, как и все остальные)
Не все, а только те из вымерших, о которых нам что-либо известно. Речь идет о вымерших видах, а не об оставшихся (изменившихся или нет – неважно).
Понятно. Вы предлагаете искать корреляцию, типа: сложнее сеть<->м.геном длиннее; проще сеть<->м.геном меньше.
Почему-то мне (с потолка) кажется, что явной такой корреляции не будет...
Может и нет, а может и да.
В связи с этом, можно подумать - при массовых катаклизмов - например при гибели динозавров - сеть должна быть "резко" упроститься - сокращался ли м.геном остальных видов в это время, чтобы освободиться от "лишнего информационного балласта" связанного с необходимости выживания в более сложной сети при наличии динозавров?
Возможно. Массовые вымирания – это отбор на уровне таксонов. Мегаэволюция продолжается.
Наверное - однако логично такой связи быть м.генома тем организмам которые находятся выше в энергетической/пищевой пирамиде - со сложности сети уровня видов непосредственно ниже (горизонтальный уровень тех, некоторых из которых они "питаются")... Типа м.геном волка зависит от сложности сети уровня зайцев... Наверное и наоборот, т.е. уровня выше. Гм.
Ну, как-то так.
Про "может быть записано больше информации" - это как посмотреть... Зависит ведь от контекста в котором эта последовательность развертывается.
Контекст – это и есть биосферная сеть, а отбор идет на уровне кодов крупных участков генома, сопоставленных крупным таксонам – участкам сети. Сеть эволюционирует, меняется ее топология и количество вершин. Сложность какого-то конкретного организма какого-то конкретного вида (крохотной точки в сети, например Homo), при таком подходе не зависит от антропного принципа, что устраняет "ошибку наблюдателя".

З.Ы. Предложенный подход куда менее субъективен в определении "сложности", т.к. использует уже готовые решения из области графов, позволяющие ввести простую количественную меру "сложности".
Дороги, которые никуда не ведут, заводят дальше всего.

Оффлайн dzver

  • *****
  • Сообщений: 2 899
  • Благодарностей: 61
    • Сообщения от dzver
Предложенный подход куда менее субъективен в определении "сложности", т.к. использует уже готовые решения из области графов, позволяющие ввести простую количественную меру "сложности".
Да, конечно.... Предложенный метод исследования, вроде вполне объективен.
Но.. интуитивно, нужно ли ожидать, что он чего-то даст?
Мне исходно почему-то, не нравилась идея что размер генома может коррелировать с некоего понятия "продвинутой сложности" - в частности также, с определенной вами "внешней" сложности биосферной сети.
Я думал как именно это сформулировать.
Разумеется все что сейчас говорю - в высшей мере интуитивно, и может быть ошибочным.

Так вот.. Какого рода "информация", должна содержаться в геноме?

Грубо (для "продвинутых многоклеточных"), можно классифицировать ее как три "вида":
- Инфа обеспечивания клеточного функционала и метаболизма (уровень клетки)
- Инфа программы развертывания многоклеточного организма - дифференцирование тканей, гормоны, всякие макро-регуляционные биологические механизмы на уровне организма ("средний" уровень)
- "Социальная" инфа - всякие инстинкты, поведенческие и сексуальные повадки и пр ("высший уровень")

Можем ли мы оценить объемы этих видов информации...

Мне интуитивно кажется, имеет место следующее - на первый взгляд "парадоксальное" утверждение: чем более информация касается "более высокого уровня" - тем она меньше как часть общей информации в геноме.
Тоесть, на спецификаций клеточного уровня тратится львиная доля информации в геноме; некоторая весьма малая часть - на макроструктуре организма; и ничтожная доля - на якобы самой "продвинутой", социальной части - инстинктов и пр.

Соображения в интуитивной подкрепе сказанного, примерно такие....
Чем более высокоуровневая инфа в геноме - тем более "голографическим" образом она записана. Т.е., она уже переиспользует нижние уровни, в определенном смысле.
Может казаться, что на описания взрослого организма - нужно довольно много информации... Но на самом деле - кодируются только механизмы его образования и функционирования - а не и детали конкретной реализации - которые получаются "сами собой" - т.е. определяются случайных-внешних условий не содержащихся в геноме + законов химии и физики, раз "механизмы нискоуровневого+регуляционного производства" запущены правильно, соответно программы.
Насчет социальных повадок... разве для описания повадок какого-нибудь червя нужно много информации? Да, поведение высших млекопитающих (и некоторых из насекомых) - выглядит довольно замысловатым и сложным... Однако опять - ведь сами конкретные детали (что конкретно будет делать в конкретной ситуации) - нигде не записаны - а только "законы поведения" - которые можно описать довольно емко, если уже все остальное дано (напр. внешние сигналы уже переработаны нервной системы/сетей до относительно высокоуровневых абстракций - за что ответствен, средний уровень)...
Аналогично, представим себе что на некоей планете нужно создать-запустить самообеспечивающийся комплекс (скажем с цели, добывания руды..). На что уйдут спецификации? Львиная доля спецификаций уйдет на наинижнего уровня - программ для производства и технологий всяких частей и базовых элементов + методов сборки + контроля + обратных связей и пр...  На "внутреннее управление взаимодействия макроструктур" уйдет намного меньше ресурсов (т.к. большая часть из необходимого уже "инкапсулирована" и обеспечена на нижнем уровне их уже существующей конструкции)...
А уже на самом высшем уровне "управления деятельности", будет вовсе и почти ничего по сравнению с остальном.

Можно привести и аналогию с программного обеспечения (у которых также много уровней). Наибольшее количество кода затрачивается на наинисшем уровне (c/asm: операционка, драйверы, и пр..); этот код переиспользуется на более высоком уровне - где информация намного компактнее (всякие библиотеки и фреймуорки на среднеуровневых языках); на самом высшем уровне - все в очень компактном виде, переиспользует йерархически существующих нижних уровней (прикладные программы/языки как lua/java и пр).

Если эта интуиция верна - то прирост сложности биосферной сети - должен даст только ничтожный вклад, в прироста мин. генома.
В этом смысле - хотя и поведение тигра намного сложнее чем какого-то жука (или червя) - на этого субъективно "очень большого" прироста "продвинутости", реально затрачивается "непропорционально" малая доля информационной емкости генома.
Подобное и для разницы при перехода м/у одноклеточных-многоклеточных организмов - хотя там вклад будет пропорционально побольше - но опять же, будет "непропорционально мал" по сравнению с субъективного ощущения "продвинутости" от одноклеточным к многоклеточным.

В рамок мутности определения "избыточности инфы" генома (хотел бы я увидеть поколение кошек, из чей геном очищены все "ненужные" гены/последовательности..) - эта разница в размеров "значащей части" генома - может оказаться и полностью в пределов ошибки измерения (особенно для ответственной про "социальной" надстройки)... И, бОльшая часть вариаций будет скорее, из-за "случайных отклонений" и/или деталей эффективности реализации, в зависимости от витиеватых путей эволюции/отбора которые имели место.
« Последнее редактирование: 20 Апр 2013 [09:46:00] от dzver »

Оффлайн Patsak

  • ****
  • Сообщений: 422
  • Благодарностей: 20
  • Ку
    • Сообщения от Patsak
Мне исходно почему-то, не нравилась идея что размер генома может коррелировать с некоего понятия "продвинутой сложности" - в частности также, с определенной вами "внешней" сложности биосферной сети.
Давайте, пока оставим длину генома (или ДНК) в запасе. Сосредоточимся на структурной сложности самой ДНК.
Цитата
Грубо (для "продвинутых многоклеточных"), можно классифицировать ее как три "вида":
- Инфа обеспечивания клеточного функционала и метаболизма (уровень клетки)
- Инфа программы развертывания многоклеточного организма - дифференцирование тканей, гормоны, всякие макро-регуляционные биологические механизмы на уровне организма ("средний" уровень)
- "Социальная" инфа - всякие инстинкты, поведенческие и сексуальные повадки и пр ("высший уровень")
Т.е. есть последовательность символов в алфавите аденин (А), гуанин (G), цитозин (C), тимин (Т). В этой последовательности есть участки, которые кодируют морфологию, метаболизм и поведение. Не стоит рассчитывать, что эти участки объединены в последовательность конкатенацией. Скорее всего они сложно перемешаны и кода мы не знаем.
Цитата
Можем ли мы оценить объемы этих видов информации...
Мне интуитивно кажется, имеет место следующее - на первый взгляд "парадоксальное" утверждение: чем более информация касается "более высокого уровня" - тем она меньше как часть общей информации в геноме.
Тоесть, на спецификаций клеточного уровня тратится львиная доля информации в геноме; некоторая весьма малая часть - на макроструктуре организма; и ничтожная доля - на якобы самой "продвинутой", социальной части - инстинктов и пр.
В этом есть смысл.
Однако, возможно ДНК не оптимизирована. Т.е. несмотря на то, что морфология и метаболизм много "весят", в последовательности их доля не велика, что-то типа БИОСа или операционной системы, а большая часть относится к высшим функциям, поведению, но она по большей части несет мало информации, хотя и занимает много места. Это так сказать поле для экспериментов, информация находится в процессе оптимизации отбором.
Цитата
Чем более высокоуровневая инфа в геноме - тем более "голографическим" образом она записана. Т.е., она уже переиспользует нижние уровни, в определенном смысле.
Т.е. расшифровать код на уровне морфологии проще чем на уровне метаболизма и проще чем на уровне поведения, потому что эта часть более проста, информативна и систематизирована.
Цитата
Аналогично, представим себе что на некоей планете нужно создать-запустить самообеспечивающийся комплекс (скажем с цели, добывания руды..). На что уйдут спецификации? Львиная доля спецификаций уйдет на наинижнего уровня - программ для производства и технологий всяких частей и базовых элементов + методов сборки + контроля + обратных связей и пр...  На "внутреннее управление взаимодействия макроструктур" уйдет намного меньше ресурсов (т.к. большая часть из необходимого уже "инкапсулирована" и обеспечена на нижнем уровне их уже существующей конструкции)...
Согласен. Если ДНК оптимизирована по длине под эту задачу, так и будет, но мы то как раз этого и не знаем, и пытаемся выяснить.
Цитата
Можно привести и аналогию с программного обеспечения (у которых также много уровней). Наибольшее количество кода затрачивается на наинисшем уровне (c/asm: операционка, драйверы, и пр..); этот код переиспользуется на более высоком уровне - где информация намного компактнее (всякие библиотеки и фреймуорки на среднеуровневых языках); на самом высшем уровне - все в очень компактном виде, переиспользует йерархически существующих нижних уровней (прикладные программы/языки как lua/java и пр).
Тут тонкий момент. На низшем уровне кода естественно больше просто потому, что более высокие уровни – это комбинации кода нижнего уровня. Т.е. код на уровне WINAPI состоит из крошечной последовательности символов CreateWindow(), а на уровне Ассемблера это целые страницы команд процессора. Естественно, имея дело с первичной структурой (страницами машинных кодов), разобрать в томах этих последовательностей закономерности команд высокого уровня не просто. Особенно, если язык нам неизвестен.
Цитата
Если эта интуиция верна - то прирост сложности биосферной сети - должен даст только ничтожный вклад, в прироста мин. генома.
Возможно. Но биосферная сложность осуществляет отбор сразу по всем уровням информации в ДНК. Т.е. нельзя сказать, что информация о морфологии или метаболизме менее или более важна чем информация о поведении. Организм может быть максимально адекватен биосфере по поведению, но не соответствовать по метаболизму или морфологии.
Т.е. прирост сложности ДНК и биосферной сети – это прирост на всех уровнях сразу, а не только на высшем.
Цитата
В этом смысле - хотя и поведение тигра намного сложнее чем какого-то жука (или червя) - на этого субъективно "очень большого" прироста "продвинутости", реально затрачивается "непропорционально" малая доля информационной емкости генома.
Подобное и для разницы при перехода м/у одноклеточных-многоклеточных организмов - хотя там вклад будет пропорционально побольше - но опять же, будет "непропорционально мал" по сравнению с субъективного ощущения "продвинутости" от одноклеточным к многоклеточным.
Поэтому субъективизм надо как то исключить. Не стоит считать тигра более продвинутым, чем червяк только потому что он демонстрирует более сложное поведение, имеет более сложную морфологию и метаболизм, более красив и ближе к нам в сети.
Если уж мы критерием сложности признаем место в биосферной сети, то оценить сложность тигра можно только количеству связей и уровню, занимаемому им в биосферной сети. Сеть осуществляет отбор тигров и червяков (т.е. их ДНК) совсем не по нашим критериям "продвинутости".
Червяк может быть "завязан" на устойчивость большей части биосферы, его ДНК код будет отражать не столько сложность самого червяка, сколько сложность места в биосферной сети, которое он занимает. Его ДНК фактически регулирует целый хаб сетевой активности.
Для биосферы, червяк, как вид, важнее тигра, как вида, его участок сети сложнее, значит и ДНК червяка сложнее ДНК тигра.
Выглядит дико, но как-то так.
(в действительности еще не известно, чья ДНК занимает более сложное место сети)
Цитата
В рамок мутности определения "избыточности инфы" генома (хотел бы я увидеть поколение кошек, из чей геном очищены все "ненужные" гены/последовательности..) - эта разница в размеров "значащей части" генома - может оказаться и полностью в пределов ошибки измерения (особенно для ответственной про "социальной" надстройки)... И, бОльшая часть вариаций будет скорее, из-за "случайных отклонений" и/или деталей эффективности реализации, в зависимости от витиеватых путей эволюции/отбора которые имели место.
Тут как раз нельзя исходить из какой-то априорной уверенности, что "ненужные" гены – это такие-то.
Нужно рассмотреть виды, как участки биосферной сети, тогда можно сопоставить сложность одних с другими, а потом взглянув на длину последовательности их ДНК (или ее внутреннюю структуру) сделать вывод, избыточна она или нет.
Например, обсуждавшаяся выше инфузория, по идее, должна занимать важнейшее место в регуляции биосферной сети, т.к. ее геном велик. С другой стороны, возможно это след прошлого, когда она такую роль играла, тогда это просто ложная избыточность "ненужные" сейчас гены, память о прошлом, не несущие ныне важной информации.
Дороги, которые никуда не ведут, заводят дальше всего.

Оффлайн астроляб

  • ***
  • Сообщений: 136
  • Благодарностей: 5
  • Мне нравится этот форум!
    • Сообщения от астроляб
Кстати, по поводу панспермии.
Сегодня запустили спутник "Бион-1М", на котором помимо монгольских песчанок, гекконов и прочей живности в космос полетят "искусственные метеориты" (базальтовые пластины с микробами внутри). Причем если песчанки и гекконы будут внутри спутника, то "метеориты" - снаружи. Месяц они проведут в условиях открытого космоса, а потом "сядут" вместе со спутником на Землю, по дороге подвергнувшись всем прелестям спуска через атмосферу.
http://ria.ru/science/20130419/933515793.html

Нулевая экспериментальная проверка теории панспермии :) Если какие-нибудь микробы выживут - можно будет запускать такие "искусственные метеориты" повыше и держать их в космосе подольше.
а как же http://www.dddkursk.ru/number/763/planet/001388/   : «Это очень интересные насекомые, личинки которых способны выдержать воздействие радиации, спирта и перепады температуры от минус 270 до плюс 106 градусов» ...
Вроде как сообщается (сообщалось), что комары выживают.

Оффлайн dzver

  • *****
  • Сообщений: 2 899
  • Благодарностей: 61
    • Сообщения от dzver
В этом есть смысл.
Однако, возможно ДНК не оптимизирована. Т.е. несмотря на то, что морфология и метаболизм много "весят", в последовательности их доля не велика, что-то типа БИОСа или операционной системы, а большая часть относится к высшим функциям, поведению, но она по большей части несет мало информации, хотя и занимает много места. Это так сказать поле для экспериментов, информация находится в процессе оптимизации отбором.
Так моя мысль в том, что "морфология и метаболизм" весят много объективно - и поэтому в последовательности их доля с необходимостью намного больше, чем "социальная часть".
Чтобы при этом предположении - "морфология и метаболизм" занимали в геноме сопостовимую долю с "социальной части" - нужно чтобы первые были бы кодированы исключительно эффективно - и при всем при этом, кодировка "социальной части" была бы дичайше избыточной - что было бы очень странно.
Тут тонкий момент. На низшем уровне кода естественно больше просто потому, что более высокие уровни – это комбинации кода нижнего уровня. Т.е. код на уровне WINAPI состоит из крошечной последовательности символов CreateWindow(), а на уровне Ассемблера это целые страницы команд процессора. Естественно, имея дело с первичной структурой (страницами машинных кодов), разобрать в томах этих последовательностей закономерности команд высокого уровня не просто. Особенно, если язык нам неизвестен.
Так именно в этом и состоит аналогия и с кодировок генома - кодировки высших уровней - переиспользуют кодировку нисших (только эта связь не состоит буквально в линейно-последовательных комбинации высокоуровневых блоков как в програмировании - а осуществлена неким так сказать, распределенно-голографским способом).
Аналогично тому - что если вы хотите скопировать программный функционал "запрограммированого железа" - на "пустой" железке - основная часть инфы которую вы должны перенести - это нискоуровневый код. Т.е. на "копирование операционки" уйдет примерно 90%, и только 10% на "продвинутый функционал".

Возможно. Но биосферная сложность осуществляет отбор сразу по всем уровням информации в ДНК. Т.е. нельзя сказать, что информация о морфологии или метаболизме менее или более важна чем информация о поведении. Организм может быть максимально адекватен биосфере по поведению, но не соответствовать по метаболизму или морфологии.
Т.е. прирост сложности ДНК и биосферной сети – это прирост на всех уровнях сразу, а не только на высшем.
Вопрос не только в том, какая информация "более важна" - а каким объемом она представлена/кодирована в геноме.
Если примерно информация наинисшего уровня - типа внутриклеточного метаболизма - занимает 90% из "неизбыточного" генома, про морфологии-регуляций самого организма - 9% из "неизбыточного" генома; и про "социальной части" - 1% из "неизбыточного" генома - и это более менее типичная ситуация.
То тогда вроде логично, что "биосферная сеть" - отбраковывает "по интерфейсу" - а это социальная часть (и морфологичная) - но ей более менее фиолетово как там на глубоком уровне, именно реализируется этот "внешний функционал".
Ну например, как на макроуровне взаимодействий важны макроскопические свойства некоего вещества - а не как они конкретно реализированы внутри, на молекулярно-атомном уровне.
Поэтому отбор за счет биосферной сети - в основном будет "переделывать/оптимизировать" где-то 2-8% из "неизбыточного" генома (остальные 90% - в основном оптимизировались - и стабилизировались - миллиардов лет назад - как объем конечно - составные "кирпичики" иначе, могут перемешиваться, отпадать, включаться самым разным образом и пр).
Поэтому субъективизм надо как то исключить. Не стоит считать тигра более продвинутым, чем червяк только потому что он демонстрирует более сложное поведение, имеет более сложную морфологию и метаболизм, более красив и ближе к нам в сети.
Конечно, я именно и не считаю.
Но также - для людей "сеть взаимодействий окружения" намного сложнее - чем для шимпанзе - однако это на длину генома практически не влияет. А то что кодирует геном как "социальный аспект" (повадки, инстинкты, и пр) - у них, примерно одинаковы.
Если уж мы критерием сложности признаем место в биосферной сети, то оценить сложность тигра можно только количеству связей и уровню, занимаемому им в биосферной сети. Сеть осуществляет отбор тигров и червяков (т.е. их ДНК) совсем не по нашим критериям "продвинутости".
Понятно. Но вопрос то не только в тем что мы признаем "критерием сложности" - а и как оно отражается (или не отражается) количественно, в "неизбыточном" геноме.
Червяк может быть "завязан" на устойчивость большей части биосферы, его ДНК код будет отражать не столько сложность самого червяка, сколько сложность места в биосферной сети, которое он занимает. Его ДНК фактически регулирует целый хаб сетевой активности.
Однако я интуитивно считаю - что именно наоборот - это может почти не влиять на объеме ДНК.
Если "нискоуровневый код" - преобладающая часть "неизбыточного" генома - то даже большие вариации "сложности места в биосферной сети" - количественно мало отразятся.
Для этого даже не необходимо считать что нискоуровневый код у человека и червяка "расшарен" - по идее он "объективно" всегда занимает большей частью "неизбыточного" генома - независимо от деталей реализации (так, как если допустить что правило что "операционка" это бОльшая часть кода - независимо от того, линукс она или уиндоус - является более менее "универсальным принципом").
(но тем более мы и так знаем, что часть нискоуровневого кода "расшарена").
Для биосферы, червяк, как вид, важнее тигра, как вида, его участок сети сложнее, значит и ДНК червяка сложнее ДНК тигра.
Вот именно что возможно, и не значит что ДНК одного или другого, должна быть существенно сложнее (в количественном смысле) - как бы не разнилась "сложность их места в биосферной сети".
Хотя конечно, все это вилами по воде писано...
Тут как раз нельзя исходить из какой-то априорной уверенности, что "ненужные" гены – это такие-то.
Нужно рассмотреть виды, как участки биосферной сети, тогда можно сопоставить сложность одних с другими, а потом взглянув на длину последовательности их ДНК (или ее внутреннюю структуру) сделать вывод, избыточна она или нет.
Например, обсуждавшаяся выше инфузория, по идее, должна занимать важнейшее место в регуляции биосферной сети, т.к. ее геном велик. С другой стороны, возможно это след прошлого, когда она такую роль играла, тогда это просто ложная избыточность "ненужные" сейчас гены, память о прошлом, не несущие ныне важной информации.
Этого я не понял.
Если у нас нет некоего "независимого правила" оценять "неизбыточности генома" - как мы вообще можем объективно оценивать его корреляции с биосферной сети.
У нас получатся двух неизвестых - эффективность кодирования, и искомая корреляция между обоих сложностей. Если корреляции нет - то мы не знаем это из-за неопределенности неэффективности кодирования ли, или ее и на самом деле нет.

Да и вообще - ниоткуда не следует, что более сложная биосферная сеть толерирует отбором более сложных-продвинутых игроков (в смысле "количества и замысловатости кода").
В состязаний по АI, часто побеждают "самые тупые" боты - с очень коротким кодом - хотя они взаимодействовали и отбирались в окружения той же сложности, как и "умных" ботов.
« Последнее редактирование: 21 Апр 2013 [05:28:34] от dzver »

Оффлайн Patsak

  • ****
  • Сообщений: 422
  • Благодарностей: 20
  • Ку
    • Сообщения от Patsak
Этого я не понял.
Если у нас нет некоего "независимого правила" оценять "неизбыточности генома" - как мы вообще можем объективно оценивать его корреляции с биосферной сети.
Я предложил критерием сложности генома считать сложность биосферной сети в терминах графов, а не какие-то "независимые правила", вроде субъективной сложности организма-носителя или длины генома, которые, в частности, предлагал Combinator. Если мы не зря критиковали его подход, то никаких "независимых критериев" быть не должно. 
Рассматривайте это, как дефиницию – любую вещь можно назвать трамваем, нужно об этом только договорится.

Давайте считать критерием сложности всех ДНК - сложность всей биосферной сети, в терминах графов, а сложность конкретной ДНК – сложностью конкретного узла, которое эта ДНК занимает.
Т.к. биосферная сеть меняется со временем, значит и сложность ДНК меняется.

ДНК между друг другом связаны вертикально - прошлым, в котором они редуцируются к общей последовательности (общему предку) и горизонтально – биосферной сетью в каждый данный момент времени. Вторая связь с одной стороны опосредованная, функциональная, через отбор организмов – носителей, с другой стороны непосредственная через горизонтальный перенос генов, например, вирусами.
У нас получатся двух неизвестых - эффективность кодирования, и искомая корреляция между обоих сложностей. Если корреляции нет - то мы не знаем это из-за неопределенности неэффективности кодирования ли, или ее и на самом деле нет.
К сожалению, так.
Да и вообще - ниоткуда не следует, что более сложная биосферная сеть толерирует отбором более сложных-продвинутых игроков (в смысле "количества и замысловатости кода").
В состязаний по АI, часто побеждают "самые тупые" боты - с очень коротким кодом - хотя они взаимодействовали и отбирались в окружения той же сложности, как и "умных" ботов.
Состязания по AI плохой пример. Биосферная сеть сейчас сложнее биосферной сети на заре жизни. Если бы в состязании по AI начали с одного бота, а потом получили из него биосферную сеть, пример был бы корректным.
Сложная биосферная сеть не обязательно толериует отбором более сложных игроков, но по нашему определению, сложная биосферная сеть эквивалентна сложной, замысловатой ДНК. Сеть может упрощаться или усложняться, как и ДНК, последнее время биосфера, по крайне мере на уровне многоклеточных, упрощается (идет вымирание видов).
Но также - для людей "сеть взаимодействий окружения" намного сложнее - чем для шимпанзе - однако это на длину генома практически не влияет. А то что кодирует геном как "социальный аспект" (повадки, инстинкты, и пр) - у них, примерно одинаковы.
Мы вроде пока не обсуждаем длину ДНК.
ДНК человека должен быть сложней ДНК шимпанзе по определению места, занимаемого человеком в биосфере.
Представьте, биосферную сеть без шимпанзе и человека. Теперь "вбросим"  в нее ДНК человека и шимпанзе и посмотрим на результат. ДНК человека окажет несравнимо большее влияние на биосферную сеть, т.е. обзаведется гораздо большим количеством связей. Возможно, она даже приведет к редукции сети, что в конечном итоге приведет к ее исключению из сети отбором.
Вопрос не только в том, какая информация "более важна" - а каким объемом она представлена/кодирована в геноме.
Если примерно информация наинисшего уровня - типа внутриклеточного метаболизма - занимает 90% из "неизбыточного" генома, про морфологии-регуляций самого организма - 9% из "неизбыточного" генома; и про "социальной части" - 1% из "неизбыточного" генома - и это более менее типичная ситуация.
То тогда вроде логично, что "биосферная сеть" - отбраковывает "по интерфейсу" - а это социальная часть (и морфологичная) - но ей более менее фиолетово как там на глубоком уровне, именно реализируется этот "внешний функционал".
Я думаю, оптимизация по интерфейсу идет быстрее, чем оптимизация на глубоких уровнях. Но т.к. виды появляются и исчезают, с ними идет и оптимизация на более глубоких уровнях, но медленней.
Так именно в этом и состоит аналогия и с кодировок генома - кодировки высших уровней - переиспользуют кодировку нисших (только эта связь не состоит буквально в линейно-последовательных комбинации высокоуровневых блоков как в програмировании - а осуществлена неким так сказать, распределенно-голографским способом).
Аналогично тому - что если вы хотите скопировать программный функционал "запрограммированого железа" - на "пустой" железке - основная часть инфы которую вы должны перенести - это нискоуровневый код. Т.е. на "копирование операционки" уйдет примерно 90%, и только 10% на "продвинутый функционал".
У меня на жестком диске столько всякой ерунды накопилось, что на "копирование операционки" уйдет примерно 1% , а остальные 99% на "продвинутый функционал".
Низкоуровневый, высокоуровневый – это неподходящие термины в случае тупого копирования информации. Операционка копирует файл, "понятия не имея", что в нем – фотка, база данных или ее собственные загрузочные файлы.
Мы, глядя на последовательность битов, не сможем определить код какого уровня на них записан. Это могут быть слова высокоуровнего языка программирования или команды ассемблера. Мы можем лишь косвенно оценить это, рассмотрев распределение "слов" в тексте.
Так моя мысль в том, что "морфология и метаболизм" весят много объективно - и поэтому в последовательности их доля с необходимостью намного больше, чем "социальная часть".
Чтобы при этом предположении - "морфология и метаболизм" занимали в геноме сопостовимую долю с "социальной части" - нужно чтобы первые были бы кодированы исключительно эффективно - и при всем при этом, кодировка "социальной части" была бы дичайше избыточной - что было бы очень странно.
А "морфология и метаболизм" – это часть "социальной сети". Это то, что делает ее сетью: общая среда обитания, общая пища, общие циклы активности. Где Вы проводите грань между уровнем "морфологии и метаболизма"  и "социальной частью" ? Это все единое целое, а введенные разделение – условно, отбор идет на всех уровнях сразу.

P.S. Знаете, что меня удивляет ? Как только речь заходит о действительно интересных вещах, всех как ветром сдувает.
Дороги, которые никуда не ведут, заводят дальше всего.

Оффлайн Combinator

  • *****
  • Сообщений: 2 628
  • Благодарностей: 88
    • Сообщения от Combinator
P.S. Знаете, что меня удивляет ? Как только речь заходит о действительно интересных вещах, всех как ветром сдувает.

Ну я, например, с большим интересом слежу за Вашей дискуссией. Кстати, сетевой подход к геномике в книжке Кунина обчсуждается довольно подробно, правда, только для мобиломы прокариот.


Оффлайн dzver

  • *****
  • Сообщений: 2 899
  • Благодарностей: 61
    • Сообщения от dzver
Я предложил критерием сложности генома считать сложность биосферной сети в терминах графов, а не какие-то "независимые правила", вроде субъективной сложности организма-носителя или длины генома, которые, в частности, предлагал Combinator. Если мы не зря критиковали его подход, то никаких "независимых критериев" быть не должно.
Рассматривайте это, как дефиницию – любую вещь можно назвать трамваем, нужно об этом только договорится.
А... хорошо что сказали четко.
Теперь понятно, про длину генома ("избыточную" или нет) - забываем, и у нас по определению "сложность" - это сложность биосферной сети узла.
(Хотя не уверен что "сложность" удачный термин - наверное лучше использовать "связность узла" или что-то вроде. Конечно все можно называть трамваем если договориться - но все же "сложность" уже как бы занятый термин и несет ассоциации.)
но по нашему определению, сложная биосферная сеть эквивалентна сложной, замысловатой ДНК
Гм.. извиняюсь что я опять "за старое" - но хочу все же уточнить - если окажется что репликатор с РНК 70 баз имеет в двухтысяч раз бОльшую "биосферную сетевую связность", чем организм с ДНК 5*10^6 баз - мы тем не менее, по определению считаем первую ДНК в двухтысяч раз "сложнее" второй.
Хотя и она в 10^5 раз короче.
Так?

У меня на жестком диске столько всякой ерунды накопилось, что на "копирование операционки" уйдет примерно 1% , а остальные 99% на "продвинутый функционал".
Низкоуровневый, высокоуровневый – это неподходящие термины в случае тупого копирования информации. Операционка копирует файл, "понятия не имея", что в нем – фотка, база данных или ее собственные загрузочные файлы.
Э ну зачем настолько грубо ; ) Вы то понимаете, что "фотки" в геноме не хранятся; да и там какое-то разделение на данных и программ на самом деле не существует (из-за самореферентных отношений все является и то и другое).
Мы, глядя на последовательность битов, не сможем определить код какого уровня на них записан. Это могут быть слова высокоуровнего языка программирования или команды ассемблера. Мы можем лишь косвенно оценить это, рассмотрев распределение "слов" в тексте.
Я просто попытался подойти с другой стороны - оценить каких "типов" информации, обязательно должно храниться каким нибудь образом в геноме (под каком соусе неважно - важно что они там должны быть) - это нам вроде, и так известно.
И потом, использовать некоторую более-менее "интуитивно-универсальную" зависимость - что алгоритмы/данные для менее абстрактного, нискоуровневого описания требуют бОльший объем инфы, чем для абстрактно-высокоуровневого.
Для этого, не нужно знать именно как выделять, или дешифрировать конкретно одно или другое - это только общие соображения для их относительных пропорций.
Например другая аналогия - если кто-то вам дает неизвестным образом архивированный "файл". Но вы точно знаете что в них содержится современного типа 3D игра (экспериментально видно что некая "черная коробка" в которой нельзя "заглянуть" - развертывает игру из этого файла).
Вы из общих соображений можете сказать что бОльшая часть данных, уходит на текстур, art, сценарии и прочей хренью и только малая часть - сам движок. (ну существует такое емпиричное правило, по меньшей мере для современных 3D игр - это так). Тогда чтобы утверждать соотношение этих пропорциий - вам достаточно знать только этот общий принцип - вне возможности или знания, как именно дешифровать или разделить одно от другого из исходного "зашифрованного архива".

Но с новой априорной дефиниции "биосферной связности" - понятно что такие оценки теперь не важны, и вообще непричем.

Однако - я тогда теперь не понимаю - раз нас не интересует собственно длина генома ("минимальная" или абсолютная - все равно) - то что у нас будет предметом исследования?
Ну, дефинировали мы "биосферную связность" узла-организма; и пусть можем как-нибудь ее конкретно количественно измерить (она не субъективна). Окей.
Что дальше...?

P.S. Знаете, что меня удивляет ? Как только речь заходит о действительно интересных вещах, всех как ветром сдувает.
н-да, ну что интересно и что нет - наверное субъективная вещь


Оффлайн Patsak

  • ****
  • Сообщений: 422
  • Благодарностей: 20
  • Ку
    • Сообщения от Patsak
Гм.. извиняюсь что я опять "за старое" - но хочу все же уточнить - если окажется что репликатор с РНК 70 баз имеет в двухтысяч раз бОльшую "биосферную сетевую связность", чем организм с ДНК 5*10^6 баз - мы тем не менее, по определению считаем первую ДНК в двухтысяч раз "сложнее" второй.
Хотя и она в 10^5 раз короче.
Так?
Совершенно верно. Вы выше упоминали о сравнении сложности "теоремы Ферма" и "шуме длительность 1 мин."
Т.к. первая ДНК имеет больше связей с другими, она "сложнее", а во второй ДНК в основном "мусор". Либо мы чего-то не учли, каких-то неочевидных биосферных связей.
Э ну зачем настолько грубо ; ) Вы то понимаете, что "фотки" в геноме не хранятся; да и там какое-то разделение на данных и программ на самом деле не существует (из-за самореферентных отношений все является и то и другое).
Простите :) , конечно деление условно.
Однако - я тогда теперь не понимаю - раз нас не интересует собственно длина генома ("минимальная" или абсолютная - все равно) - то что у нас будет предметом исследования?
Ну, дефинировали мы "биосферную связность" узла-организма; и пусть можем как-нибудь ее конкретно количественно измерить (она не субъективна). Окей.
Что дальше...?
Дальше корреляция с длиной. Если есть, зовем Combinator, он нам быстро это дело экстраполирует в прошлое и выдает вердикт – жизнь появилась на Земле или в космосе :)
Дороги, которые никуда не ведут, заводят дальше всего.

Оффлайн Combinator

  • *****
  • Сообщений: 2 628
  • Благодарностей: 88
    • Сообщения от Combinator
Дальше корреляция с длиной. Если есть, зовем Combinator, он нам быстро это дело экстраполирует в прошлое и выдает вердикт – жизнь появилась на Земле или в космосе :)

Хм, интересно, а кто тут пару десятков постов выше меня пинал, что экстраполяция кривой в прошлое даже на 20% от её длины совершенно недопустима, ибо не имеет под собой никакого научного обоснования? Или если её построить "правильно", то всё таки можно? :)


Оффлайн Скеп-тик

  • *****
  • Сообщений: 9 999
  • Благодарностей: 576
  • Был...
    • Сообщения от Скеп-тик

Так вот.. Какого рода "информация", должна содержаться в геноме?

Грубо (для "продвинутых многоклеточных"), можно классифицировать ее как три "вида":
- Инфа обеспечивания клеточного функционала и метаболизма (уровень клетки)
- Инфа программы развертывания многоклеточного организма - дифференцирование тканей, гормоны, всякие макро-регуляционные биологические механизмы на уровне организма ("средний" уровень)
- "Социальная" инфа - всякие инстинкты, поведенческие и сексуальные повадки и пр ("высший" уровень)
На "Элементы.ру" достаточно хорошо и популярно представлена молекулярная биология. И что понимаешь, читая долго и упорно?
А то, что геном просто синтезирует биологические молекулы, которые потом совершенно без него организовывают метаболизм, клеточные мембраны, межклеточные ионные связи... То есть выпускает тысяча-разнообразные кирпичи, которые сами, под действием электро-химических законов разбегаются по своим местам и строят организм. Причем сложность организма определяется только количеством произведенных кирпичей. Так, геном шимпанзе и человека практически индентичен. Разница в том, что часть генома, производящая нейролептиды, у человека повторена 200 раз по отношению к шимпанзе. Это как в экономике - на двести домостроительных фирм в США приходиться одна в России. И результат заметен.:(
« Последнее редактирование: 21 Апр 2013 [13:58:10] от Скеп-тик »