Санкт-Петербургский государственный университет информационных технологий, механики и оптики
Ю.Д. Корнюшкин
ОСНОВЫ СОВ...
37 downloads
279 Views
6MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Санкт-Петербургский государственный университет информационных технологий, механики и оптики
Ю.Д. Корнюшкин
ОСНОВЫ СОВРЕМЕННОЙ ФИЗИКИ (Квантовая механика, физика атомов и молекул, физика твердого тела, ядерная физика) Учебное пособие
Санкт-Петербург 2005
Корнюшкин Ю.Д. Основы современной физики (квантовая механика, физика атомов и молекул, физика твердого тела, ядерная физика) / Учебное пособие. СПб: СПбГУ ИТМО, 2005. 326 с. Пособие составлено в соответствии с программой по физике для технических вузов. В нем в доступной форме изложены основы квантовой механики, атомной физики, физики твердого тела, физики атомного ядра. Автор, по возможности, стремился изложить основные достижения физики двадцатого века. В основе пособия лежат лекции, прочитанные автором в течение ряда лет для студентов СПбГУ ИТМО. Главное внимание в пособии уделено обсуждению физического смысла и содержания основных законов природы в области микромира, а также физике твердотельного состояния. Учебное пособие предназначено, в первую очередь, для студентов младших курсов. Однако оно может быть полезным и студентам старших курсов, а также аспирантам и преподавателям различных специальностей. Рецензент – Е.П. Григорьев, профессор Санкт-Петербургского государственного университета © Санкт-Петербургский государственный университет информационных технологий, механики и оптики, 2005 © Корнюшкин Ю.Д., 2005
Юрий Дмитриевич Корнюшкин ОСНОВЫ СОВРЕМЕННОЙ ФИЗИКИ (квантовая механика, физика атомов и молекул, физика твердого тела, ядерная физика)
Учебное пособие Редакторы К.К. Боярский, А.В. Сечкарев, С.К. Стафеев, Н.А. Ярышев Редакционно-издательский отдел Санкт-Петербургского университета информационных технологий, механики и оптики Лицензия № 00408 от 05.11.99. Зав. РИО Н.Ф. Гусарова Подписано к печати 05.02.2005. Заказ № 806. Тираж 100 экз.
3
Содержание ПРЕДИСЛОВИЕ .............................................................................................6 ПРЕДИСЛОВИЕ АВТОРА ................................................................................7 ГЛАВА 1. ЗАКОНЫ КВАНТОВОЙ МЕХАНИКИ...............................9 1.1. ВОЛНА ДЕ БРОЙЛЯ ................................................................................9 1.2. ОПЫТ ДЭВИССОНА - ДЖЕРМЕРА ........................................................13 1.3. ВОЛНОВАЯ ФУНКЦИЯ .........................................................................19 1.4. ФИЗИЧЕСКИЙ СМЫСЛ ВОЛНОВОЙ ФУНКЦИИ ......................................21 1.5. СООТНОШЕНИЯ НЕОПРЕДЕЛЕННОСТЕЙ ..............................................26 1.6. УРАВНЕНИЕ ШРЕДИНГЕРА .................................................................34 1.7. ЭЛЕКТРОН В ПОТЕНЦИАЛЬНОЙ ЯМЕ ...................................................40 1.7.1. Линейный гармонический осциллятор.....................................41 а) Классический осциллятор.......................................................................41 б). Квантовый осциллятор ..........................................................................44
1.7.2. Движение электрона в потенциальной яме с плоским дном .....47 1.7.3. Движение электрона над потенциальной ямой..........................54 1.7.4. Движение электрона над потенциальным барьером.................57 1.7.5 Движение электрона в направлении потенциального барьера конечной толщины ....................................................................60 1.7.6. Автоэлектронная эмиссия............................................................64 ГЛАВА 2. ФИЗИКА АТОМОВ И МОЛЕКУЛ .....................................66 2.1. ОСНОВНЫЕ ПОНЯТИЯ .........................................................................66 2.2. ОПЕРАТОР МОМЕНТА ИМПУЛЬСА .......................................................67 2.3. АТОМ ВОДОРОДА ................................................................................71 2.4. СНЯТИЕ ВЫРОЖДЕНИЙ СОСТОЯНИЙ В АТОМЕ ВОДОРОДА ..................75 4.1. Снятие вырождения состояний по магнитному квантовому числу. ...............................................................................75 4.2 Снятие вырождений по орбитальному квантовому числу.......78 2.5. СПЕКТРАЛЬНЫЕ СЕРИИ АТОМА ВОДОРОДА.........................................81 2.6. СПЕКТРАЛЬНЫЕ СЕРИИ АТОМОВ ЩЕЛОЧНЫХ МЕТАЛЛОВ ..................83 2.7. ФИЗИЧЕСКАЯ ПРИЧИНА ВОЗНИКНОВЕНИЯ ТОНКОЙ СТРУКТУРЫ В СПЕКТРЕ АТОМОВ ЩЕЛОЧНЫХ И ЩЕЛОЧНОЗЕМЕЛЬНЫХ ЭЛЕМЕНТОВ ........................................................................................89 2.8. ЭНЕРГИЯ СПИН-ОРБИТАЛЬНОГО ВЗАИМОДЕЙСТВИЯ ..........................96 2.9. РАСПРЕДЕЛЕНИЕ ЭЛЕКТРОНОВ В АТОМЕ ПО СЛОЯМ И СОСТОЯНИЯМ ................................................................................100 2.10. ДВУХАТОМНАЯ МОЛЕКУЛА ............................................................102
ГЛАВА 3. ОСНОВЫ ФИЗИКИ ТВЕРДОГО ТЕЛА..........................114 3.1. КЛАССИФИКАЦИЯ ТВЕРДЫХ КРИСТАЛЛИЧЕСКИХ ТЕЛ .....................114 3.1.1. Ионные кристаллы. .................................................................117
4 3.1.2. Ковалентные кристаллы ........................................................118 3.1.3. Металлические кристаллы.....................................................119 3.1.4. Молекулярные кристаллы.......................................................120 3.2. ОСНОВНЫЕ ОСОБЕННОСТИ КЛАССИЧЕСКОЙ И КВАНТОВОЙ СТАТИСТИКИ .....................................................................................120 3.3. ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ ФЕРМИ-ДИРАКА ..................................125 3.4. КВАЗИЧАСТИЦЫ В КРИСТАЛЛИЧЕСКОМ ТВЕРДОМ ТЕЛЕ ...................131 3.4.1 Фононы кристаллической решетки........................................131 3.4.2 Квазиэлектроны кристаллической решетки. ........................137 3.5. РАСПРЕДЕЛЕНИЕ СВОБОДНЫХ ЭЛЕКТРОНОВ ПО ЭНЕРГИЯМ .............139 3.6. ЯВЛЕНИЕ СВЕРХПРОВОДИМОСТИ .....................................................145 3.7. СВОБОДНЫЕ ЭЛЕКТРОНЫ В КРИСТАЛЛИЧЕСКОЙ РЕШЕТКЕ ТВЕРДОГО ТЕЛА ................................................................................152 3.7.1 Адиабатическое приближение................................................152 3.7.2 Приближение самосогласованного поля. ...............................153 3.7.3 Приближение почти свободных электронов.........................154 3.7.4 Приближение сильной связи ....................................................155 3.8. ЗОННАЯ ТЕОРИЯ ТВЕРДЫХ ТЕЛ .........................................................156 3.9. ЭФФЕКТИВНАЯ МАССА КВАЗИЭЛЕКТРОНА В ТВЕРДОМ ТЕЛЕ............161 3.10. ДЫРОЧНАЯ ПРОВОДИМОСТЬ ...........................................................164 3.11. ЭЛЕКТРОХИМИЧЕСКИЙ ПОТЕНЦИАЛ В СОБСТВЕННЫХ ПОЛУПРОВОДНИКАХ ........................................................................167 3.12. ПРИМЕСНЫЕ ПОЛУПРОВОДНИКИ ....................................................171 3.13. ЭЛЕКТРОПРОВОДНОСТЬ ПОЛУПРОВОДНИКОВ ................................175 3.13.1 Собственный полупроводник.................................................176 3.13.2 Примесные полупроводники...................................................178 3.14. КОНТАКТ ДВУХ ПОЛУПРОВОДНИКОВ .............................................179 3.15. ФИЗИЧЕСКИЕ ОСОБЕННОСТИ КОНТАКНОГО СЛОЯ В p-n ПОЛУПРОВОДНИКЕ ..................................................................182 3.16. КОНТАКТ МЕТАЛЛ - ПОЛУПРОВОДНИК ...........................................187 3.17. СООТНОШЕНИЕ ЭЙНШТЕЙНА .........................................................191 3.18. ВЫПРЯМЛЯЮЩЕЕ ДЕЙСТВИЕ p-n ПЕРЕХОДА ..................................193 3.19. ТРАНЗИСТОРЫ .................................................................................199 3.20. ВНУТРЕННИЙ ФОТОЭФФЕКТ В ПОЛУПРОВОДНИКАХ ......................203 3.20.1 Фоторезисторы (фотосопротивления) ..............................204 3.20.2 Фотодиоды, фотоэлементы ................................................206 3.21. ФИЗИЧЕСКИЕ ОСНОВЫ РАБОТЫ ЛАЗЕРОВ .......................................211 3.21.1 Время жизни атома в возбужденном состоянии ...............211 3.21.2 Принцип детального равновесия...........................................214 3.21.3 Основные принципы работы лазеров ...................................217 3.21.4 Гелий -неоновый лазер............................................................218 3.21.5 Полупроводниковые лазеры ...................................................221 3.22. ЭМИССИОННЫЕ ЯВЛЕНИЯ ...............................................................229 3.22.1 Термоэлектронная эмиссия из металлов .............................230
5 3.22.2 Полевая электронная эмиссия...............................................236 3.22.3 Фотоэлектронная эмиссия ...................................................237 3.22.3.1 Фотоэлектронная эмиссия из металлов. ....................................239 3.22.3.2 Фотоэлектронная эмиссия из полупроводников .......................241
ГЛАВА 4. ОСНОВЫ ФИЗИКИ АТОМНОГО ЯДРА.......................242 4.1. ЭЛЕМЕНТАРНЫЕ ЧАСТИЦЫ ..............................................................242 4.1.1Основные свойства элементарных частиц ............................244 4.1.2 Кварковая структура адронов................................................247 4.2. СТРОЕНИЕ АТОМНОГО ЯДРА .............................................................250 4.3. ЭНЕРГИЯ СВЯЗИ ЯДРА .......................................................................251 4.4. ЯДЕРНЫЕ СИЛЫ .................................................................................255 4.5. СТРОЕНИЕ АТОМНЫХ ЯДЕР ...............................................................261 4.5.1 Модель жидкой капли ..............................................................265 4.6. ФОРМУЛА ВЕЙЦЗЕККЕРА ..................................................................265 4.7. МЕЗОННАЯ ТЕОРИЯ ЯДЕРНЫХ СИЛ ...................................................268 4.8. МОДЕЛЬ ЯДЕРНЫХ ОБОЛОЧЕК...........................................................272 4.9. НАПРАВЛЕННОСТЬ РАДИОАКТИВНЫХ ПРЕВРАЩЕНИЙ .....................278 4.10. РАДИОАКТИВНОСТЬ ........................................................................283 4.10.1 Закон радиоактивного распада.............................................284 4.10.2 α- распад .................................................................................288 4.10.3 β- распад..................................................................................296 4.11. ЯДЕРНЫЕ РЕАКЦИИ .........................................................................299 4.12. ЭФФЕКТИВНОЕ СЕЧЕНИЕ ЯДЕРНОЙ РЕАКЦИИ. ................................303 4.13. ДЕЛЕНИЕ ТЯЖЕЛЫХ ЯДЕР ПРИ ЗАХВАТЕ НЕЙТРОНА. ......................304 4.14. ПРОДУКТЫ ДЕЛЕНИЯ УРАНА ПОД ДЕЙСТВИЕМ ТЕПЛОВЫХ НЕЙТРОНОВ .......................................................................................311 4.15. ЦЕПНАЯ ЯДЕРНАЯ РЕАКЦИЯ ...........................................................314 4.16. РЕАКЦИИ СИНТЕЗА ЛЕГКИХ ЯДЕР ...................................................319 4.16.1 Термоядерные реакции...........................................................319 4.16.2 Термоядерные источники энергии Солнца...........................324
6
Предисловие Автор предлагаемого учебного пособия, кандидат технических наук, доцент Юрий Дмитриевич Корнюшкин более полувека проработал на кафедре физики СПБГУ ИТМО. Все годы Великой Отечественной войны вплоть до Победы он провел на фронте, выполнял тяжелые военные обязанности рядового, автоматчика, артиллериста, а после войны закончил инженерно-физический факультет и аспирантуру. В течение многих лет он проводил все виды занятий, включая полный лекционный цикл по курсу общей физики, участвовал в составлении ряда учебно-методических пособий. Ю.Д. Корнюшкиным написан и опубликован обширный цикл работ по физической электронике. До последнего времени он проявлял неизменный интерес к совершенствованию учебно-лабораторного практикума, постановке новых современных лабораторных работ. Предлагаемая читателю книга – последний труд Ю.Д. Корнюшкина, закончить который помешала его внезапная кончина в канун 80летнего юбилея. Сотрудники кафедры, ознакомившись с содержанием рукописи (проф. А.В. Сечкарев – гл. 1, 2; проф. С.К. Стафеев и доц. К.К. Боярский – гл. 3; проф. Н.А Ярышев – гл. 4), считают, что данное учебное пособие по своему содержанию значительно превышает тот объем заключительной части лекционного курса физики, который читается в последние годы на инженерных факультетах нашего университета. Рецензенты кафедры не пытались вносить в содержание и структуру пособия существенные дополнения, о которых сказано в авторском предисловии, а ограничились лишь исправлением замеченных неточностей, сохраняя авторский стиль изложения. Учтено также большинство замечаний, сделанных рецензентом рукописи д.ф.-м.н., профессором Е.Г. Григорьевым. Считаем, что данное пособие будет полезным дополнением к имеющимся учебникам и позволит студентам младших и старших курсов расширить кругозор в области современной физики. Зав. кафедрой физики, д.т.н., профессор
С.К. Стафеев
7
Предисловие автора Одна из главных задач преподавания физики в вузе состоит в том, чтобы объяснить студенту основные законы природы, развить у него навыки использования полученных знаний, а также выработать основы логики физического мышления, особенностью которого является умение не только оперировать идеальными моделями изучаемого явления, но и соотносить эти модели с реальной действительностью. Физика - быстро развивающаяся наука. И то, что ранее казалось ее новыми достижениями, через некоторое время на поверку оказывается либо устаревшими, либо общепринятыми представлениями. При этом, однако, старые достижения не становятся неверными: развитие физики лишь определяет границы их применимости. Настоящее учебное пособие предназначено для студентов, обучающихся по программе 2-го курса технического университета, но, тем не менее, некоторые его разделы могут быть полезными студентам старших курсов, аспирантам и преподавателям. В главе 1 формулируются основные законы квантовой механики в наиболее доступной для понимания студентами 2-го курса форме. В ней рассмотрено движение электрона в потенциальной яме конечной глубины. В результате полная энергия электрона оказывается зависящей от ширины и глубины потенциальной ямы, плотность уровней полных энергий в пределах потенциальной ямы распределена неравномерно. Глава 2 посвящена физике атомов и молекул. В ней, в частности, объясняется физическая причина вырождения состояний в атоме водорода по орбитальному и магнитному квантовым числам. При анализе двухатомной молекулы вводится понятие обменного взаимодействия. Обсуждается физическая природа спин-орбитального взаимодействия и влияния его на особенности спектров атомов щелочных металлов. В главе 3 излагаются основы физики твердого тела. Значительный акцент сделан на физике сверхпроводников 2-го рода как наиболее перспективных в настоящее время сверхпроводников. Подробно обсуждается внутренний фотоэффект в полупроводниках. Объясняются физические принципы работы фотосопротивлений, фотодиодов, фотоэлементов, оптронной пары. Сформулированы физические принципы создания гетеропереходов. Объяснена физика лазерного излучения.
8
В главе 4 обсуждаются основы физики атомного ядра. В отличие от общепринятого подхода, изложение основ физики атомного ядра начинается с обзора физических свойств элементарных частиц. Теория α-распада доводится до количественного расчета энергии вылетевших из ядра α-частиц. Следует заметить, что распределение изложения по отдельным главам довольно неравномерно. Наибольший объем приходится на 3-ю главу, и это не случайно: именно этот раздел физики во второй половине 20 века получил наибольшее развитие, именно в этой области были сделаны наиболее выдающие достижения и открытия. Основой учебного пособия являлись лекции, прочитанные автором в течение многих лет в Ленинградском институте точной механики и оптики на дневном отделении. Пособие охватывает все основные разделы современной физики, а именно, элементы квантовой механики, физики атомов и молекул, физики твердого тела, физики атомного ядра и элементарных частиц. Автор по возможности пытался на доступном для студентов уровне изложить основные идеи современной физики, объяснить явления и законы в области микромира. Как правило, изложение ведется с использованием математического аппарата, известного студентам 2-го и старших курсов. Автор в пособии сознательно широко использовал математику, считая, что только на ее основе можно строго объяснить основные законы природы. Это, в первую очередь, относится к применению теории дифференциальных уравнений, используемых при анализе некоторых конкретных задач с целью выявления количественных физических закономерностей в изучаемых явлениях природы. Применение доступного для студентов математического аппарата имеет несомненное достоинство, так как позволяет описать законы природы не только качественно, но и количественно. В тех же случаях, когда для описания физического процесса необходимо применять специальный математический аппарат, выходящий за пределы студенческой программы, используется лишь качественный подход с указанием основных идей в проводимых физических рассуждениях. Такой подход, в частности, осуществлен при описании явления сверхпроводимости. Пособие называется "Основы современной физики". Оправданием такому названию является то, что в нем фактически охвачены важнейшие открытия в физике, начиная с 1923 года по 2000 год. Не все разделы физики в пособии в равной степени отражены достаточно подробно, некоторые из них вообще опущены. Это связано с тем, что
9
одни находятся в стадии интенсивного формирования, другие – из-за того, что их содержание выходит за пределы программы 2-го курса, по которой автор составлял настоящее пособие. Автор при отборе материала был ограничен объемом учебного пособия, и поэтому некоторые важные разделы физики, такие, как явление сверхтекучести, эффекты Мессбауэра, Джозефсона и некоторые другие, не нашли своего отражения. Автор надеется, что учащийся, изучивший настоящее пособие, будет хорошо ознакомлен с основами современной физики, с ее достижениями и проблемами. Автор уверен, что знание основ современной физики в дальнейшем позволит студенту, уже находясь на старших курсах, более успешно овладевать многими специальными техническими дисциплинами.
10
Глава 1. ЗАКОНЫ КВАНТОВОЙ МЕХАНИКИ 1.1. Волна де Бройля Из предыдущих разделов физики нам известно, что такие процессы природы, как тепловое и рентгеновское излучения, фотоэффект и др., хорошо объясняются на основе использования корпускулярных представлений. С другой стороны, интерференция, дифракция, поляризация света объясняются на основе волновых представлений, согласно которым свет есть электромагнитные волны. Таким образом, свет, в широком понимании этого слова, представляет своеобразное сочетание волновых и корпускулярных свойств материи. В одних условиях эта материя наиболее четко проявляет волновые свойства, в других – корпускулярные. Одним из критериев применимости того или иного подхода является величина поперечного сечения цуга волн: если поперечное сечение цуга волны сравнимо с размерами частиц вещества, то свет, электромагнитная волна проявляют корпускулярные свойства и электромагнитное излучение можно рассматривать как поток световых частиц, если же поперечное сечение цуга волн значительно больше размера частиц, то свет следует рассматривать как поток электромагнитной волны. Таким образом, свет как материя обладает двойственной природой. Пусть на границу раздела двух сред падает плоская электромагнитная волна. y
v1x v1y
v1
i1
v2y
v2x v2
x
i2
Рис. 1.1.1. Изменение скорости частицы у поверхности раздела сред без учета преобразования полей Из рис. 1.1.1 следует, что v1x = v2x или
11
sin i 1 v1 n 1 1 c c , n 2= ; .= , = = v2 n sin i 2 v 2 n 2 v1 n2 где v – фазовая скорость, c – скорость света в вакууме, n = – абсоn1 лютный показатель преломления, i1, i2 – углы падения и преломления. Применив корпускулярный подход, мы получили закон, обратный закону преломления. Таким образом, хотя для оптических явлений корпускулярный подход применим, но он дает неверный результат. Причина несоответствия корпускулярной теории опыту состоит в том, что для описания этого процесса необходим иной подход, при котором учитываются взаимодействия множества световых частиц с атомами вещества. Математической основой описания такого процесса является кинетическое уравнение переноса. В 1923 г. французский ученый де Бройль высказал предположение, что двойственная природа материи должна проявляться не только у электромагнитного излучения. Он предположил, что электроны при определенных условиях должны проявлять волновые свойства. Он писал: "В оптике в течение столетия слишком пренебрегали корпускулярным способом рассмотрения явлений по сравнению с волновым. Не делалось ли в теории материи обратной ошибки? Не думали ли мы слишком много о картине частиц и не пренебрегали ли чрезмерно картиной волн?" В 1929 г за эту работу ему была присуждена Нобелевская премия. Де Бройлю было 30 лет, когда он высказал свою гипотезу о волновых свойствах материи и вывел формулу, с помощью которой можно вычислить длину волны, связанную с движущимся электроном. К мысли о том, что электрон должен обладать волновыми свойствами, де Бройля привели следующие факты и соображения. В природе существует аналогия между геометрической оптикой и механикой. Основные законы этих двух разделов физики можно сформулировать в тождественно математической форме. Это значит, что вместо того чтобы рассматривать движение заряженной частицы в электрическом ρ поле с потенциалом ϕ(r ) , можно рассматривать распространение поρ тока частиц в пространстве с абсолютным показателем n(r ) . Заметим, что рассматриваемая аналогия в настоящее время охватывает все разделы физики и в ряде случаев бывает очень полезной. Покажем это на конкретном примере. Допустим, имеется две контактирующие между собой среды. Потенциал электрического поля в верхней среде φ1, а потенциал в нижv1 sin i 1 = v 2 sin i 2 ; n 1 =
12
ней среде φ2. На границе раздела происходит постепенное изменение потенциала. Тогда напряженность электрического поля в пограничном слое можно представить в виде (см. рис. 1.1.2): ρ ρ dϕ ρ E=− j = Ey j. dy Если φ1> φ2 , ρ ρ dϕ < 0, E ↑↑ j , dy и в пределах пограничного слоя наρэлектрон будет действовать сила ρ Fy = eE , e < 0,
направленная вниз, а в направлении координатной оси 0Х сила действовать не будет, так как Ex=0. Следовательно, ρ ρ (1.1.1.) F1x = F2 x = 0, v1x = v 2 x ; F y ↑↓ j .
sin i1 v 2 = . sin i 2 v1 y me v1y
v1x v1 x me v2y
v2x v2
Рис. 1.1.2. Изменение скорости частицы у поверхности раздела сред с учетом преобразования полей Электрон, проникая в пространство с потенциалом φ1, приобретает кинетическую энергию k1 =
me v12 = e∆ϕ1 2
Тогда в пространстве с потенциалом φ2 его кинетическая энергия будет m v2 k2 = e 2 = e∆ϕ 2. 2 Значит,
13 1 ⎞2
v 2 ⎛ ∆ϕ 2 (1.1.2) ⎟ =⎜ v1 ⎜⎝ ∆ϕ 1 ⎟⎠ Подставляя полученное выражение (1.1.2) в (11.1.), имеем: 1
⎛ ∆ϕ 2 ⎞ 2 ⎟ (1.1.3) =⎜ sin i 2 ⎜⎝ ∆ϕ 1 ⎟⎠ Формула (1.1.3) является математической записью закона преломления в электронной оптике. Закон преломления в геометрической оптике формулируется в виде sin i 1 n (1.1.4) . n21 = 2 = n 1 sin i 2 Из сравнения выражений (1.1.3) и (1.1.4) можно получить относительный показатель преломления в электронной оптике: sin i 1
1
⎛ ∆ϕ ⎞ 2 n21 = ⎜⎜ 2 ⎟⎟ ⎝ ∆ϕ1 ⎠
(1.1.5)
В случае электромагнитных волн плоская электромагнитная волна представляет собой пучок параллельных лучей, для которых волновой фронт – плоскость, перпендикулярная направлению распространения лучей, а волновая поверхность – система параллельных поверхностей ρ ρ с колебаниями векторов E и H в одной и той же фазе ρ ρ ρ ρ ρ 2π ρ r E = E0 cos(ωt − k x) ⋅ j , H = H 0 cos(ωt − k x) ⋅ k , k = ,k = . r λ Однако, если принять корпускулярную точку зрения, то плоскую электромагнитную волну можно рассматривать как поток световых частиц, перемещающихся в пространстве параллельно (рис. 1.1.3) или даже связать ее с отдельно движущимся фотоном. Если в пространстве существует поток свободных, не взаимодействующих между собой электронов (на эти электроны не действуют внешние силы), то в таком потоке электроны должны перемещаться параллельно. Эта картина верна, если пользоваться корпускулярными представлениями. Но если воспользоваться волновыми представлениями, т.е. применить понятие волны материи, то с таким потоком частиц можно связать некий волновой процесс, и описание движения электронов с волновой точки зрения должно быть аналогично описанию плоской электромагнитной волны. Следовательно, такой волновой процесс также можно изобразить в виде плоской волны. Поэтому де Бройль предположил, что между волновыми и корпускулярными
14
характеристиками электрона должна существовать точно такая же взаимосвязь, как и между соответствующими характеристиками фотона. И, кроме того, де Бройль предположил, что корпускулярное описание движения свободного электрона должно быть подобно корпускулярному описанию фотона, волновое описание свободного электрона должно быть подобно волновому описанию потока фотонов в электромагнитной волне (рис. 1.1.3). y
y
ρ E ρ E ρ E
ρ
mф c
ρ
mф c mф
ρ c
фотоны
фронт волны
ρ ρ E = E0 cos(ω t − k x) ⋅ j
ρ c ρ c ρ c x
me me me
ρ v ρ v ρ v
ρ v ρ v ρ v
свободные электроны
фронт волны
x
ρ
ϕ = ϕ 0 cos(ω t − k x)
а б Рис. 1.1.3. Модель плоской волны для фотонов (а) и для электронов (б) По определению импульс фотона и энергия фотона соответственно равны c pф = mф c, ε = mф c 2 = pф с, ε = hν, ν = . λ Значит, ε hν h h (1.1.6) = ; pф = , pф = = λ c c λ где λ – длина электромагнитной волны, h – постоянная Планка, pф – импульс фотона. Таким образом, уравнение (1.1.6) связывает между собой как корпускулярные, так и волновые характеристики света воедино, а коэффициентом связи является постоянная Планка. Де Бройль предположил, что уравнение (1.1.6) можно применять не только для фотонов, но и для электронов. А так как импульс электрона pe=p=mev, то длина волны некоторого волнового процесса, связанного с движущимся электроном, будет определяться из уравнения h p = = me v. λ Отсюда
15
λ=
h . me v
И если me v 2 = eU ≤ 10 кэВ, 2 то масса электрона me = m0, т.е. практически не отличается от массы покоя. Тогда в соответствии с законом сохранения энергии можем записать: K=
1
⎛ 2eU ⎞ 2 m v2 (1.1.7) ⎟⎟ . eU = e ; v = ⎜⎜ 2 m ⎝ e ⎠ После подстановки найденного выражения для скорости имеем h λ= 1 ⎛ 2eU ⎞ 2 ⎟⎟ m⎜⎜ ⎝ me ⎠ или 12,3 ⋅ 10 −10 12,3 λ= м = 1 Å, [U]=В. 1 U2 U2 Пусть U = 100 B. Тогда λ = 0,12 нм. Если же U = 10000 B, то λ= 0,012 нм. Таким образом, длина волны свободного электрона, двигающегося со скоростью v, соответствует длине волны рентгеновского излучения. На это обстоятельство мы обратим внимание в дальнейшем. Такое совпадение, разумеется, носит случайный характер.
1.2. Опыт Дэвиссона - Джермера
Любая гипотеза, как бы она ни была привлекательна и правдоподобна, остается гипотезой до тех пор, пока она не подтвердится опытом. Только прямые опыты, в которых отчетливо проявлялись бы волновые свойства частиц, могли бы подтвердить правильность идеи де Бройля. В 1922 г. по заказу американской фирмы "Белл-телефон" Клинтон Джозеф Дэвиссон (1881–1958) и его сотрудник Кансмен изучали отражение электронов от поверхности металла и при этом обнаружили какие-то аномалии. В 1925 г. Дэвиссон, находясь в Европе, показал
16
свои графики Максу Борну, Джеймсу Франку (аспиранту Борна) в Геттингене и Дугласу Хартри в Оксфорде. Все они признали, что аномалии на графиках свидетельствуют о проявлении волновых свойств электронов, т.е. волн де Бройля, хотя и не убедили в этом Дэвиссона. Вскоре после возвращения в Америку в экспериментальной установке Дэвиссона во время работы случилась авария: треснула вакуумная трубка, и нагретый в это время поликристаллический Ni под действием кислорода воздуха окислился. После восстановления установки и прокаливания образца в вакууме исследования совместно с Лестером Альбертом Джермером (1896–1971) были продолжены. Вскоре выяснилось, что спектр отраженных электронов имеет отчетливо выраженные интерференционные максимумы. В результате к концу 1927 г. они убедились в реальности существования волн материи. Но еще в 1925 г. студент М. Борна Вальтер Эльзассер, получив задание разобраться с этим явлением, предположил, что аномалии на графиках Дэвиссона объясняются электронными волнами де Бройля. Он послал в журнал краткую заметку, в которой объяснил результаты опытов Дэвиссона и Кансмана дифракцией волн материи. Однако на эту заметку тогда никто не обратил внимание. Схема экспериментальной установки Дэвиссона представлена на рис. 1.2.1. Что же произошло в установке Дэвиссона после прокаливания? В результате прокаливания и дальнейшего остывания на поверхности поликристаллического Ni возникли отдельные монокристаллы. При попадании электронов на монокристалл Ni число электронов в направлении угла скольжения меняется в зависимости от энергии электронов. Оказалось, что существуют такие значения энергии, при которых отражение электронов максимально, и существуют такие значения энергии, при которых число отраженных электронов минимально. В результате на экспериментальном графике наблюдаются чередующиеся максимумы и минимумы интерференции электронных волн.
θ
θ
Ni
Рис. 1.2.1. Схема установки Девиссона
J
17
Если теперь при заданном значении угла скольжения θ и полярного угла менять энергию первичных электронов, то график должен иметь вид, изображенный на рис.2.2.2. I
1
xi = U i2 , i = 1, 2, 3, 4
x1
x2
x3
x4
1
U2
Рис. 1.2.2. Интерференция картины электронов
1
θ
2
θ
θ θ
d
Рис. 1.2.3. Модель интерференции волн в кристалле Известно, что монокристалл Ni можно представить в виде системы кристаллографических плоскостей. Если принять, что отражение волн материи происходит от кристаллографических плоскостей, то в результате интерференции волн максимум отраженной волны будет возникать в случае разности хода лучей, кратной длине волны (рис. 1.2.3). Из рис. 1.2.3 следует, что разность хода у интерферирующих лучей 1 и 2 ∆ = 2d sin θ .
Отсюда (1.2.1) 2d sin θ = mλ, m = 1, 2, 3, ... , где d – межплоскостное расстояние, θ – угол скольжения. Если считать, что гипотеза де Бройля правильна, то длина волны
18
12,3 ⋅ 10 −10 , м U и после подстановки в (1.2.1) получаем: 12,3 ⋅ 10 −10 12,3 ⋅ 10 −10 2d sin θ = m ; ; U = m c1 , c1 = 2d sin θ U λ=
1
1
1
⎛U ⎞2 ⎛U ⎞2 ⎛U2 ⎞2 ⎟⎟ = 2 ; ⎜⎜ 3 ⎟⎟ = 3 ; ⎜⎜ 4 ⎟⎟ = 4 . ⎜⎜ ⎝ U1 ⎠ ⎝ U1 ⎠ ⎝ U1 ⎠ Таким образом, возникновение максимумов на экспериментальных графиках следует рассматривать как результат интерференции волн неизвестной пока природы, которые связаны с движущимся электроном в пространстве. Значит, движение электронов в пределах кристаллической решетки можно рассматривать как волновой процесс. Наличие экспериментально наблюдаемых максимумов и минимумов и их правдоподобное объяснение является доказательством правильности гипотезы де Бройля о наличии в природе волн материи. Как оказалось впоследствии, волновыми свойствами обладают не только электроны, но и любые микрочастицы.
1.3. Волновая функция
Итак, несомненно, поток электронов обладает и волновыми, и корпускулярными свойствами. Это значит, что двигающемуся электрону соответствует какой-то волновой процесс неизвестной пока природы. Де Бройль также не понимал физическую природу этого волнового процесса и поэтому предложил описать его с помощью функции, которую он назвал волновой функцией, т.е. функцией, которая описывает движение частиц с волновой точки зрения. Но при этом он считал, что при таком описании должна сохраниться аналогия с описанием волнового процесса в оптике. Мы знаем, что движение фотонов в виде пучка параллельных лучей описывается плоской электромагнитной волной. Следовательно, и движение свободных электронов, перемещающихся в пространстве параллельно и прямолинейно, также должно описываться в виде плоской волны, образованной волновой функцией. Введение волновой функции, ее конкретный вид проще всего выяснить на примере использования знакомых нам явлений. Уравнение плоской электромагнитной волны имеет вид E = E0 cos( ω t − k x), H = H 0 cos( ω t − k x).
19
Запишем теперь это же уравнение так, чтобы в него вошли как корпускулярные, так и волновые характеристики материи. Для этого перейдем от ω и k, характеризующих процесс с волновой точки зрения, к энергии кванта ε и импульсу кванта p, характеризующим тот же процесс с корпускулярной точки зрения: 2π 2π h ε hν = ; ω = 2πν = ε = ; η= h h η 2π 2 π 2 π h 2π p = k= = p= ; η λ h λ h здесь p – импульс фотона. Тогда, заменив ω и k в уравнении плоской электромагнитной на ε и p, получим: ⎛1 ⎞ ⎛1 ⎞ E = E0 cos⎜ (ε t − px )⎟, H = H 0 cos⎜ (ε t − px )⎟. ⎝η ⎠ ⎝η ⎠ Аналогичное выражение получается, если плоскую волну выразить не через косинус, а через синус. Поэтому в общем случае эти две тригонометрические функции можно объединить и записать уравнение плоской электромагнитной волны в более общем виде: i i − (ε t − p x ) − (ε t − p x )
E = E0 e
η
, H = H0 e
η
.
При такой форме записи мы видим, что в уравнении плоской электромагнитной волны отображаются и волновые, и корпускулярные свойства материи. Волновые свойства здесь проявляются в том, что эти уравнения записаны в виде волны, а корпускулярные свойства проявляются в том, что параметрами электромагнитной волны являются энергия фотона ε и импульс p фотона, причем под ε здесь понимается полная энергия фотона или других микрочастиц, если подобные рассуждения проводить для них. Если же движение фотона происходит в произвольном направлении, то в общем случае уравнение плоской электромагнитной волны с учетом корпускулярных свойств материи будет E = E0 e
−
i (ε t − pρ rρ) η
−
i (ε t − pρ rρ) η ,
H = H 0e ρ ρ ρ ρ E0 = const , H 0 = const , r = x i + y j + z k . Де Бройль в своих физических рассуждениях исходил из предвзятой, но очень плодотворной идеи. Он считал, что законы природы и уравнения, при помощи которых описываются эти законы как с волновой, так и с корпускулярной точек зрения, во всех физических явлениях должны быть едины и поэтому должны иметь тождественный ,
20
вид. Поэтому де Бройль предложил воспользоваться аналогичным выражением ρдля описания волновых свойств электрона, только вместо ρ векторов E и H , имеющих ясный физический смысл в случае светового потока, ввести некоторую волновую функции ψ, записав с помощью этой функции уравнение плоской волны: −
i
(ε t − px )
(1.3.1) ψ = ψ 0e η , где в случае плоской волны ψ0 = const. Не надо думать, что волновая функция, которая здесь была введена по аналогии, является характеристикой только электрона. Нет! При помощи этой функции можно также описать распространение света в пространстве как с волновой, так и с корпускулярной точек зрения. Но только физический смысл волны де Бройля будет отличаться от физического смысла электромагнитной волны. Введение волновой функции ψ есть новая математическая формулировка одного из законов природы, который проявляет свое действие в микромире. На приведенном примере мы вновь убеждаемся в том, что математическая формулировка основных законов природы не выводится, а постулируется, о них догадываются. Поскольку введенная волновая функция есть закон природы, отображающий объективную реальность, и поскольку ее аналитическое выражение получено путем использования аналогии, т.е. по существу по догадке, то все рассуждения, связанные с постулированием вида волновой функции, являются яркой иллюстрацией того, что, как правило, фундаментальные законы природы являются обобщением результатов эксперимента в виде конкретных аналитических формул. Итак, на примере волновой функции ψ мы проследили все этапы открытия волновой функции для свободного электрона, мы как бы проанатомировали само открытие волновой функции, при помощи которой можно описать движение электрона с волновой точки зрения. Де Бройль считал, что уравнение (1.3.1) описывает движение свободного электрона с полной энергией ε = mec2 и импульсом p = mev. Предположим, что в пространстве существуют такие точки и такие моменты времени, для которых фаза колебаний всегда постоянная. Тогда для свободного электрона, у которого ε = const, p = const, dx dx ε c 2 ε t − px = const , ε − p = 0 ; vфаз = = = > c. dt dt p v Следовательно, фазовая скорость волны де Бройля не совпадает со скоростью движения частицы, поскольку она больше скорости света в вакууме. Поэтому фазовая скорость определяет всего лишь скорость
21
перемещения фазы в пространстве некоторого колебательного процесса, описывающего движение электрона с волновой точки зрения и не больше. Это указывает на то, что волновая функция не может непосредственно описать движение электронов в пространстве, она имеет иной более сложный физический смысл. Итак, оказывается, что фазовая скорость свободного электрона больше скорости света в вакууме. С этой скоростью частицы в пространстве перемещаться не могут. Если же ввести в рассмотрение такие гипотетические частицы, как тахионы, то окажется, что они в пространстве могут перемещаться со скоростью больше скорости света в вакууме, но это уже будут не реально существующие в природе частицы. Нечто подобное имеет место в оптике, когда при рассмотрении распространения света в анизотропных средах мы вынуждены применять такие понятия, как фазовая и лучевая скорости, имеющих разный физический смысл. Иначе обстоит дело с групповой скоростью волн де Бройля. Известно, что для любого волнового процесса
vгруп = Подставляя сюда ε
= ε0 + mv 2
dω dε = . dk dp
2
и p = mv, где ε0 – энергия покоя, m
– масса, v – скорость частицы (полагаем v<<с), получим vгруп= v. То есть движению частицы в пространстве отвечает групповая скорость волны, иными словами – скорость перемещения волнового пакета. 1.4. Физический смысл волновой функции
Физический смысл волновой функции раскроем на примере оптического явления, последовательно рассматривая его с волновой и корпускулярной точек зрения. Допустим, что экран освещается пучком параллельных лучей монохроматического света. Площадь поверхности экрана равна S. Пусть на поверхность экрана за 1 с попадает N квантов. Из уравнений Максвелла для электромагнитных волн следует, что энергия электромагнитных волн в равной степени определяется величиной электрической и магнитной составляющей волны. Но при энергетическом взаимодействии потока электромагнитной волны с веще-
22
ством существенную роль играет лишь ее электрическая составляющая. Поэтому уравнение плоской электромагнитной волны будет иметь вид −
i
(ε t − p x )
E = E0e η . Известно, что энергетический поток излучения Ф для поверхности S пропорционален E02 , где E0 – амплитуда колебаний напряженности электрического поля в электромагнитной волне, падающей на поверхность S. Но так как, по определению, поток электромагнитной волны есть мощность электромагнитной энергии (энергии облучения поверхности за 1с), то тот же поток равен числу квантов N, попадающих на поверхность S за 1с. Каждый квант несет энергию hν , поэтому полная энергия, переносимая N квантами за 1с, будет N hν . Следовательно, (1.4.1) Ф = a 1 E02 = N ⋅ hν. Выделим теперь в пределах поверхности экрана S его элемент площади ∆si. На выделенный элемент площади ∆si будет падать энергетический поток ∆Фi, он пропорционален E0i2 и ni, где E0i – амплитуда колебаний напряженности электрического поля той части электромагнитной волны, которая падает на выделенный элемент площади экрана, ni – число квантов, которые падают на тот же выделенный элемент площади за 1с. Тогда имеем (1.4.2) ∆Ф i = a i E02i = n i hν. Разделим (2) на (1): ∆Ф a1E02i n i hν n i (1.4.3) = = = . N hν N hν N Ф Отношение ni/N есть отношение числа благоприятных случаев, состоящих в попадании ni квантов за 1с на выделенный элемент площади ∆si, к общему числу наблюдаемых случаев, состоящих в том, что на всю поверхность экрана S за 1с попадает N квантов. Как известно из курса высшей математики, это отношение (строго говоря, при ni → 0 ) представляет собой вероятность осуществления данного соN бытия. Так как ni << N, то это отношение обозначим n dω = i << 1. N Тогда с учетом (1.4.3) имеем
23
dω =
a2 E02i
,
a1 . N hν Отсюда видно, что квадрат напряженности электрического поля в электромагнитной волне пропорционален вероятности попадания n i квантов за 1 с на выделенный участок поверхности ∆si, т.е. мы пришли к новой физической интерпретации амплитуды напряженности электрического поля электромагнитной волны. Теперь воспользуемся понятием волновой функции. Вспомним, как мы ввели это понятие. Это понятие нами было введено на основе аналогии, существующей между оптическими и электрическими явлениями, на основе существующей аналогии движения между потоком фотонов в пучке параллельных лучей и потоком свободных электронов. Для фотонов можем записать: a2 =
−
i
(ε t − p x )
−
i
(ε t − p x )
Ei = E0i e η , ψ = ψ 0e η . Из сравнения этих двух функций мы можем заключить, что ψ0 аналогично E0i , ψ02 аналогично E0i2. Так как волновую функцию можно применить не только к электронам, но и к фотонам, то применительно к фотону E0i2 также аналогична ψ02. Исходя из сказанного, можем записать E0i = a3ψ0 . Тогда для фотонов имеем: dω = a 2 E02i = aψ 02 . Но, кроме того, dω = a4ds. Заметим, амплитуда волновой функции ранее никак не была определена, поэтому можно перейти от знака пропорциональности к знаку равенства, записав dω = ψ02 ds. Волновая функция – комплексная величина, следовательно, 2
ψ = ψψ* = ψ 0 e
−
i (ε t − px ) η
⋅ ψ 0e
−
i (ε t − p x ) η
= ψ 02 .
Отсюда 2
ψ =
dω . ds
Итак, квадрат модуля волновой функции пропорционален вероятности попадания одного фотона на единицу площади участка облучаемой поверхности. Очевидно, точно такой же физический смысл должна иметь волновая функция не только при описании потока фотонов, но и при описании потока электронов и других микрочастиц. Подобное статистиче-
24
ское толкование волновой функции было предложено М. Борном (1882–1970) в 1926 г. И лишь в 1954 г. за статистическую интерпретацию волновой функции ему была присуждена Нобелевская премия. Если теперь провести подобные рассуждения для пространственного случая, т.е. поставить вопрос о том, какое число фотонов или других микрочастиц может находиться в микрообъеме dV в течение какого-то промежутка времени, то вероятность местонахождения микрочастицы в указанном микрообъеме dV будет определяться выражением 2 (1.1.4) dω = ψ dV , где dV = dxdydz, этот объем охватывает изменение координат от x до x+dx, от y до y+dy, от z до z+dz. Следовательно, в общем случае, dω 2 (1.1.5) ψ = . dV Таким образом, |ψ|2 есть плотность вероятности распределения микрочастиц в пространстве, это есть вероятность местонахождения микрочастицы в единице объема геометрического пространства. |ψ|2 есть плотность вероятности. Тогда вероятность найти микрочастицу в объеме V, как следует из (1.4.5), равна V
2
ω = ∫ ψ dV .
(1.1.6)
0
И если известна ψ-функция, соответствующая данному состоянию частицы, то вероятности различных процессов определяются однозначно, что дает возможность судить о поведении множества частиц с вероятностной точки зрения, т.е. описать их поведение методами теории вероятности. Если считать, что местонахождение микрочастицы в пространстве - событие достоверное, т. е. частица все время находится в объеме V, то вероятность такого события всегда равна единице. Поэтому V
∫ψ
2
dV = 1.
(1.1.7)
0
Условие (1.1.7) называется условием нормировки, поскольку это условие накладывает определенные ограничения на величину амплитуды волновой функции ψ0 . Условие нормировки по существу есть иная форма записи закона сохранения полного числа микрочастиц в пространстве. Так как ψ=ψ(x, y, z, t), то условие нормировки должно
25
выполняться для любого момента времени, в противном случае оно не имеет физического смысла. Знание волновой функции позволяет описать процессы природы вероятностным способом, а также позволяет определить средние значения физических величин, например, среднее значение координаты, среднее значение скорости и др.: При определении средних значений других физических величин часто используют операторную форму записи: V
V
0
0
ε = ∫ ψ*εˆ ψ dV ,
∫ψ
2
dV = 1.
V
ρ ρ p = ∫ ψ* pˆ ψ dV , 0
ρ где εˆ – оператор полной энергии, p – оператор импульса. Среднее значение энергии при переходе из состояния m в состояние n тогда записывается следующим образом (рис. 2): V
ε = ∫ ψ*m εˆ ψndV = m εˆ n . 0
ε 0
εm
m
εn
n
Рис. 2. Квантовый переход между двумя скачками Допустим, микрочастица некоторое время находится в объеме V=hs. Тогда V
∫ψ
2
dV < 1.
0
Это обстоятельство следует учитывать, например, при определении вероятности взаимодействия электронов с веществом в процессе облучения вещества потоком электронов. Допустим, облучаемое вещество представляет собой металлическую пленку.
26 0
h x
Рис. 1.4.2. Модель облучения пленки электроном Объем облучаемой пленки изображен на рис. 1.4.2. А так как часть потока электронов проходит через пленку, то V1
∫ψ
2
dV < 1.
0
Следовательно, условие нормировки для волновой функции в этом конкретном случае должно иметь вид: 0
∫ ψ1
−∞
2
h
∞
2
2
dx + ∫ ψ 2 dx + ∫ ψ 3 dx = 1 . 0
h
Тогда знаменатель в выражении для среднего значения физической величины не будет равен единице. Например, теперь среднее значение энергии в пределах металлической пленки следует вычислять по формуле ⎞ ⎛h ε = ⎜ ∫ ψ *εˆ ψ ⎟ ⎟ ⎜ ⎠ ⎝0
⎛h 2 ⎞ ⎜ ψ dx ⎟ . ⎟ ⎜∫ ⎠ ⎝0
Обобщим сказанное. 1. Волновая функция сама по себе не выражает физического смысла, физический смысл имеет лишь ее квадрат модуля – он равен плотности вероятности местонахождения микрочастицы в единице объема геометрического пространства в пределах выделенного микрообъема dV . 2. В квантовой механике параметры состояния микрочастицы, например, ε, p , определяются вероятностным способом, точное значение полной энергии и импульса, а также других параметров определить невозможно, точно можно определить лишь их средние значения. 1.5. Соотношения неопределенностей
Итак, мы видели, что свет можно рассматривать и как поток световых частиц, фотонов, и как электромагнитную волну. То же самое можно сказать и об электронах и других микрочастицах. Например, в
27
опыте по отражению от монокристалла Ni поток электронов проявляет волновые свойства; однако во всех типах электроннолучевых трубок, например, в кинескопах телевизоров, поток электронов проявляет корпускулярные свойства, ведет себя как поток отрицательно заряженных частиц. Подчеркнем еще раз, что подобная двойственность имеет место и у других микрочастиц, а именно, всегда в природе имеются явления, в которых частицы проявляют волновые свойства, и имеются явления, в которых эти же частицы проявляют корпускулярные свойства. Из анализа многочисленных опытов с микрочастицами с учетом волновых и корпускулярных свойств вытекает принцип неопределенности Гейзенберга, который, в сущности, представляет один из фундаментальных законов природы в микромире. С одной стороны, этот принцип имеет большое философское значение, а с другой – он находит практическое применение при выполнении некоторых конкретных расчетов. Физическая причина наличия этого закона заключается в двойственной природе материи. Открытие закона соотношения неопределенностей связано с именем Вернера Гейзенберга. Весной 1925 г. по приглашению Н. Бора из города Геттинген (Германия) в город Копенгаген прибыл В. Гейзенберг. Там он сразу попал в обстановку научных споров, в среду людей, для которых физика была главным делом их жизни. Основной вопрос, который обсуждал Гейзенберг, состоял в следующем: почему в атоме электрон не подчиняется законам электродинамики, почему в процессе движения электрон не падает на ядро и даже не излучает, если атом не возбужден? В конце концов, после многих раздумий и обсуждений со своими коллегами по работе он пришел к выводу, что понятие траектории электрона в атоме не имеет физического смысла, оно к электрону в атоме неприменимо. Рассмотрим на примере наиболее понятных нам световых явлений физическую причину возникновения соотношения неопределенности. Пусть в пространстве на плоский экран I со щелью падает пучок параллельных лучей. После экрана поместим линзу, в фокальной плоскости которой расположен другой экран (рис. 1.5.1). Тогда, как мы знаем, на втором экране будет возникать интерференционная картина, соответствующая дифракции от одной щели. Дифракционная картина будет особенно четко видна, если ширина входной щели сравнима с длиной волны света. Условие минимума в случае дифракции от одной щели a sin ϕ = κλ,
28
где a – ширина щели, κ = 1, 2, 3, . . . , λ – длина волны, κ < a / λ . Тогда угловая ширина дифракционного максимума λ ∆ϕ = , ∆κ = 1 . a cos ϕ И если a >> λ , то ∆ϕ << 1 , если a << λ , то ∆ϕ > 90° , и дифракция как в первом, так и во втором случаях наблюдаться не будет. Значит, для наблюдения четкой дифракционной картины необходимо, чтобы a ≈ λ . Это обстоятельство мы используем в дальнейшем, когда будем более подробно рассматривать физическую причину возникновения соотношений неопределенностей. a I
x
Л2
R
Л1
ϕ ∆ϕ
II
ρ cx ρ cy ϕ
ρ c
y
Рис. 1.5.1. Возможная схема наблюдения интерференции волн при рассеянии на щели Если к анализу результата опыта применить корпускулярный подход, то можно считать, что после прохождения через щель поток световых частиц, фотонов, отклоняется от первоначального направления на величину угла дифракции ϕ . Причину такого отклонения можно видеть во взаимодействии фотонов с веществом экрана I и возникающем в результате этого рассеянии. Положение одного фотона в потоке световых частиц в направлении оси Оx можно определить лишь с точностью, равной ширине щели a . Таким образом, неточность в определении координаты x любого из падающих фотонов будет ∆x = a , поскольку в нашем распоряжении нет приборов, при помощи которых без нарушения условий исходного
29
опыта можно более точно определить координату фотона x. Наряду с этим существует еще и неопределенность положения фотона в пределах дифракционного максимума, который образован потоком рассеянных фотонов. Вероятность углового распределения дифрагированных фотонов не одинакова для различных углов дифракции: имеются направления, в которых фотоны отклоняются с большей вероятностью, и имеются направления, в которых фотоны практически не отклоняются, т.е. вероятность их дифракции в этом направлении практически равна нулю. Этим и объясняется наличие на экране II участков с максимальной и минимальной освещенностями. Стало быть, неопределенность в определении направлении движения фотона обусловлена конечной шириной максимума, величину которого обозначим ∆ϕ . Итак, фотон в пространстве летит где-то в пределах угла ∆ϕ , но где именно – мы не знаем, у нас нет способа, при помощи которого можно уточнить положение фотона без нарушения условий исходного опыта. Стало быть, неопределенность углового положения фотона будет равна ∆ϕ . Фотон распространяется со скоростью света c . Масса покоя фотона m0 ф = 0 , это означает, что в природе нет такой системы отсчета, в которой фотон был бы неподвижен. Однако масса движущегося фотона – так называемая релятивистская масса – всегда отлична от нуля и может быть вычислена по формуле: ε mф = 2 . с Заметим, что понятие релятивистской массы не является общепринятым. Однако "безмассовость" фотона не противоречит наличию у него импульса pф = ε / c Импульс фотона p = mф c , а проекция импульса на координатную ось Ох будет равна p x = mф c x . Тогда неточность в определении проекции импульса на ось Ох будет равна ∆p x = mф ∆cx . Из рис. 1.5.1 видно, что cx = c sin ϕ, ∆cx = c cos ϕ∆ϕ , поэтому h ∆p x = mф c cos ϕ∆ϕ = cos ϕ∆ϕ . λ
30
Таким образом, угловой неопределенности движения фотона ∆ϕ соответствует неопределенность величины проекции импульса ∆px . Составим теперь произведение h h (1.5.1) ∆p x ∆x = cos ϕ∆ϕ ⋅ a = a cos ϕ∆ϕ . λ λ До сих пор мы использовали корпускулярный подход к объяснению явления дифракции от одной щели. Применим теперь волновые представления о свете. Известно, что условие минимума дифракции от одной щели имеет вид: a sin ϕ = κλ, κ = 1,2,3,... < a / λ . Тогда разность углов между двумя соседними минимумами, которая, собственно, и определяет угловую ширину максимума, может быть найдена из выражения: a cos ϕ∆ϕ = λ∆κ = λ, κ = 1 , и после подстановки в (1.5.1) получаем (1.5.2) ∆p x ∆x = h . Из (1.5.2) следует: чем точнее задана координата фотона, т.е. чем меньше ∆x, чем меньше ширина входной щели a , тем менее точно можно определить проекцию импульса ∆px . И наоборот, чем точнее известна проекция импульса, т.е. чем меньше угловая ширина максимума, тем менее точно может быть определена координата микрочастицы. Это предельная точность определения координаты, ее величина не зависит от особенностей постановки опыта, так как она вытекает из закона природы. Полученное в результате проведенных рассуждений уравнение (1.5.2) соответствует идеальному случаю, когда измерение отдельных параметров движения микрочастицы проводилось без учета ошибок эксперимента и побочных дифракционных механизмов. На самом деле погрешность опыта всегда увеличивает как ∆px , так и ∆x . Поэтому уравнение (1.5.2) следует заменить неравенством (1.5.3) ∆p x ∆x > h . Далее, можно показать, что для направления вдоль оси Оy Rλ3 h, ∆p y ∆y = 4 a cos ϕ где R – радиус дуги окружности экрана II . Но a ≈ λ, cos ϕ ≈ 1, R >> a, Поэтому
31
∆p y ∆y > h .
Итак, в общем случае с учетом (1.5.3) и (1.5.4) имеем: ∆px ∆x > h , ∆p y ∆y > h ,
(1.5.4)
(1.5.5)
∆pz ∆z > h . Система неравенств (1.5.5) и представляет собой соотношения неопределенностей Гейзенберга. Мы получили их на примере дифракции света, однако они выполняются для любых микрочастиц. Соотношения неопределенностей, записанные в виде системы неравенств (1.5.5), выполняются только для проекций импульсов и координат на одноименные координатные оси. Поэтому для проекций на разноименные координатные оси правая часть неравенств (1.5.5), в частности, может быть равна нулю, например, ∆p x ∆y ≥ 0, ∆p z ∆x ≥ 0. В этом случае проекцию импульса и координату вдоль разноименных направлений в мысленном опыте можно определить одновременно с любой точностью. Так, можно совершенно точно определить и проекцию импульса на ось Оx и координату y. В этом случае ∆px = 0 ,
∆y = 0 . Из системы неравенств (1.5.5) для проекций импульса и радиуса вектора на соответствующие координатные оси можно получить еще одно неравенство, связывающее между собой неопределенность величины полной энергии микрочастицы с неопределенностью момента времени, когда частица имеет указанную полную энергию. Покажем это на примере фотона. ρ Пусть r есть направление, вдоль которого фотон движется со скороρ ρ стью c . Для направления r запишем соотношение неопределенности: ρ ρ (1.5.6) ∆p∆r > h, ∆p∆r > h. Энергия фотона ε ф = mф c 2 = pc.
Импульс и координата фотона в момент времени t : ε p = , r = ct. c Тогда неопределенность значения импульса и неопределенность значения координаты фотона соответственно равны ∆ε ∆p = , ∆r = c∆t. c
32
и после подстановки найденных значений в (1.5.6) получаем (1.5.7) ∆ε∆t > h . Установленное неравенство (1.5.7) справедливо не только для фотонов, но и для иных микрочастиц. Физический смысл неравенства (1.5.7) следующий: чем точнее известен момент времени, когда была определена энергия микрочастицы, тем менее точно может быть определена ее полная энергия, и наоборот. А применительно к свойствам самой системы его можно сформулировать так: чем меньше длительность некоторого энергетического состояния системы, тем больше неопределенность в знании ее полной энергии. Так как p x = mvx , то h (1.5.8) ∆υ x ∆x > . m Неравенство (1.5.8) позволяет установить границу применения классической и квантовой механик. Так, если координата микрочастицы определяется настолько точно, что неопределенность ∆x ее положения в пространстве меньше характерного линейного размера частицы, то при анализе ее движения можно применять корпускулярный подход, если же эта неопределенность больше ее характерного размера, то для описания движения необходимо использовать волновую функцию. (Характерным размером может быть, например, размер атома или молекулы). Допустим, нам известен способ, с помощью которого можно определить скорость электрона в атоме с точностью ∆vx = 1мм/с. Тогда из (1.5.8) следует, что ∆x ≈ 0,7м. В этом случае ∆x >> R, где R – радиус ядра атома. Такой электрон в процессе движения проявляет только волновые свойства. Если же эта скорость определена, допустим, в кинескопе телевизора, то электрон следует рассматривать как частицу. Таким образом, движение электрона в атоме, в кристаллической решетке твердого тела может быть описано с помощью волновой функции, его положение в пространстве определяется величиной плотности вероятности. Соотношение неопределенностей не отрицает возможность одновременного определения координаты и импульса микрочастицы, их одновременное измерение возможно лишь с определенной точностью. В этом утверждении заключается отказ от некоторых представлений, укоренившихся в физике того времени. Так, в классической физике
33
широко пользуются понятием траектории движения материальной точки, траектории движения частицы, причем под траекторией понимается зависимость координаты, определяющей положение материальной точки в пространстве, от времени. Знание траектории предполагает знание с любой точностью и координаты, и скорости (координаты и импульса). В классической механике координата и скорость материальной точки в любой момент времени в принципе могут быть определены одновременно с любой точностью, это значит, что движение материальной точки, движение центра масс в пространстве происходит по определенной траектории. В квантовой механике одновременное абсолютно точное определение координаты и импульса микрочастицы в принципе невозможно. Поэтому понятие траектории движения отсутствует, оно не имеет физического смысла. Мы, конечно, можем указать путь, пройденный электроном, но тогда ничего не можем сказать о том, в какой момент времени электрон будет занимать то или иное положение в пространстве. В классической механике всегда имеется возможность однозначно предсказать будущее по прошедшему. В квантовой механике однозначность предсказания заменяется вероятностью предсказания. Из соотношений неопределенности вытекает принцип дополнительности. Он был сформулирован Н. Бором в виде следующего утверждения: координату и импульс микрочастицы нельзя абсолютно точно измерить не только одновременно, но и с помощью одного и того же прибора. В самом деле, чтобы измерить импульс атома и при этом не очень сильно его изменить в результате воздействия на атом самого прибора, необходим очень легкий подвижный датчик, способный перемещаться вместе с атомом в процессе измерения. Но такая подвижность приведет к тому, что его положение в пространстве окажется весьма неопределенным. Для измерения координаты необходим прибор с очень большой массой датчика. Поэтому при попадании частицы в такой датчик положение датчика в пространстве меняться не будет. Таким образом, в природе всегда существуют две сопряженные физические величины, одновременное измерение которых в принципе невозможно. Такими сопряженными величинами, в частности, являются координата и импульс частицы, потенциальная и кинетическая энергии и т.д. Гносеологическая причина несовместимости дополнительных понятий заключается в двойственной природе материи. Этот закон является универсальным и охватывает все без исключения явления природы.
34
1.6. Уравнение Шредингера
Уравнение Шредингера является основным законом квантовой механики, его роль является такой же, какую второй закон Ньютона играет в классической механике. Эрвин Шредингер (1887–1961) в 1911 г. окончил Венский университет. В 1925 г. он стал профессором Цюрихского университета. Шредингер знал, что в природе существует оптико-механическая аналогия, которую впервые установил Гельмгольц. Но Гельмгольц доказал ее лишь для геометрической оптики, в которой не учитываются волновые свойства света. Шредингер же предположил, что оптикомеханическая аналогия сохраняется и в волновой оптике. Это значит, что любое движение частиц можно рассматривать как распространение некоторой волны. Квантовая механика – это раздел физики, описывающий движение микрочастиц в пространстве с учетом волновых и корпускулярных свойств материи. Квантовая механика рассматривает движение только тех объектов, которые в процессе движения проявляют волновые свойства. Поэтому квантовая механика движение макротел вообще не описывает. Критерий, с помощью которого можно указать границу применимости квантовой механики, определяют соотношения неопределенностей. Если ∆x ≥ z или ∆v x ≥ v x , где z – характерный размер частицы, то для решения задачи следует применять квантовую механику. Если же ∆x << z или ∆v x << v x , то движение микрочастицы можно рассматривать без учета ее волновых свойств, и следует применять классическую механику. Слово "механика" в термине "квантовая механика" как бы подчеркивает, что эта наука изучает законы движения микрочастиц, а не их природу. Подобно тому, как классическая механика занимается изучением движения объектов, не вдаваясь в объяснение природы этих объектов, так и квантовая механика объясняет движение электронов вокруг ядер атомов на основе тех и только тех свойств ядер и электронов, которые важны для решения данной конкретной задачи. Теоретическое объяснение законов теплового излучения, явления фотоэффекта, природы и свойств рентгеновских лучей, гипотеза де Бройля о волнах материи – все это были важнейшие этапы в развитии теоретических основ физики атома, молекул, твердого тела. Однако эти результаты явились лишь предварительным этапами при обосновании уравнения, описывающего движение электрона с учетом его
35
двойственной природы – волновой и корпускулярной. Решающий шаг в этом направлении сделал Шредингер в 1926 г., когда получил уравнение, с помощью которого оказалось возможным описать движение электрона и других микрочастиц с учетом волновых и корпускулярных свойств. Это уравнение отображает один из основных законов природы в области микромира. И подобно тому, как все основные законы природы не выводятся, а постулируются, устанавливаются по догадке, так и это уравнение не выводится, а постулируется, устанавливается на основе физической аналогии с использованием некоторой доли физической интуиции. В физике до сих пор мы знали два закона природы, отображающих корпускулярные и волновые свойства материи. 1. Второй закон Ньютона: d 2x (1.6.1) F =m 2 . dt Решением уравнения (1.6.1) является уравнение траектории материальной точки в пространстве. Ограничимся пока одномерным движением вдоль координаты x. 2. Волновое уравнение для напряженности электрического поля: 1 ∂2E ∂2E (1.6.2) = 2 2 . 2 ∂x υ ф ∂t Решением уравнения (1.6.2) является уравнение электромагнитной волны
⎤ ⎡ i E = E 0exp[− i (ωt − κx )] = E 0exp⎢− (εt − px )⎥. (1.6.3) ⎦ ⎣ η Если теперь сравнивать между собой уравнения (1.6.1) и (1.6.2), то уравнение Шредингера является как бы промежуточным уравнением, в котором учтены и волновые, и корпускулярные свойства микрочастиц, оно играет точно такую же роль, какую в классической играет второй закон Ньютона, а в электродинамике – волновое уравнение. Отметим, что в квантовой механике понятия силы, кинетической энергии, траектории не используются, так как здесь они не имеют физического смысла. Объясняется это тем, что наличие силы позволяет из (1.6.1) определить траекторию движения микрочастицы. Но само понятие траектории в квантовой механике отсутствует, поэтому должно отсутствовать и понятие силы. Рассмотрим теперь те соображения, которые могут привести к установлению уравнения Шредингера. Наши рассуждения проведем на примере свободного электрона. Как и раньше, будем исходить из того,
36
что волновые свойства электрона описываются волновой функцией ψ в виде плоской волны, введенной по аналогии с плоской электромагнитной волной (3). Волновая функция свободного электрона по своей структуре подобна уравнению плоской электромагнитной волны, поэтому Шредингер предположил, что в природе должно существовать такое волновое уравнение, решением которого является волновая функция ψ : ∂ 2ψ 1 ∂ 2ψ , = ∂x 2 vф2 ∂t 2
(1.6.4)
где vф – фазовая скорость волны, описывающая движение свободного электрона с вероятностной точки зрения. Таким образом, Шредингер, как и де Бройль, при формулировке основного уравнения квантовой механики использовал метод аналогии. Так как исходное уравнение (1.6.4) является волновым, то и сама квантовая механика также еще называется волновой механикой. Однако уравнение (1.6.4) не является окончательным, а представляет лишь некоторый промежуточный результат в процессе формулировки основного уравнения, поскольку в записанном виде это уравнение характеризует движение микрочастицы лишь с волновой точки зрения. Учтем теперь ее корпускулярные свойства. Ранее мы нашли выражение для фазовой скорости волновой функции, описывающей движение свободного электрона в пространстве: dx ε vф = = , dt p Здесь ε – полная энергия электрона, p – импульс электрона. Волновая функция свободного электрона
ψ = ψ0
i − ( εt − px ) η e .
Поэтому p2 . ∂ 2ψ p 2 ⎛ ε 2 ⎞ ⎜ ⎟ = − ψ = − ψ η2 ∂x 2 ε 2 ⎜⎝ η2 ⎟⎠ Кинетическая энергия свободного электрона p2 K= 2m или p 2 = 2mK .
(1.6.5)
37
Подставим полученное выражение для квадрата импульса в (1.6.5): 2m ∂ 2ψ (1.6.6) =− Kψ. 2 η ∂x Уравнение (1.6.6) справедливо лишь для частного случая движения свободного электрона. Попробуем теперь уравнение (1.6.6) видоизменить так, чтобы оно было справедливым не только для свободного электрона, но и для электрона в поле других консервативных сил. В этом случае кинетическая энергия электрона (1.6.7) K = ε − U ( x ), где U (x) – потенциальная энергия электрона. Следовательно, в общем случае, p 2 = 2mK = 2m(ε − U ( x ) ). Подставим найденное выражение в (1.6.6): ∂ 2ψ 2m = − 2 (ε − U ( x) )ψ 2 ∂x η или ∂ 2 ψ 2m (1.6.8) (ε − U ( x) )ψ = 0 . + ∂x 2 η2 Уравнение 1.6.8) и есть основное уравнение квантовой механики для микрочастицы в поле внешних консервативных сил, причем в случае свободного электрона потенциальная энергия электрона U = 0 . Так как в уравнение (1.6.8) время явным образом не входит, то его решение будет одним и тем же для любого момента времени. Поэтому уравнение (1.6.8) называется стационарным уравнением Шредингера. При выводе уравнения Шредингера была допущена физическая неточность: в (1.6.7) кинетическая энергия K была выражена через потенциальную энергию U, что противоречит соотношению неопределенности. Действительно, из физического смысла уравнения (1.6.7) следует, что в одном и том же опыте одновременно известны две физически сопряженные величины – кинетическая и потенциальная энергии, т.е. в одном и том же опыте можно определить и точное значение импульса, и точное значение координаты, что в принципе невозможно. Единственным оправданием для Шредингера является то, что при составлении своего уравнения Шредингер не знал закона – соотношения неопределенности, этот закон был опубликован позднее. В общем случае, для реального пространства трех измерений, стационарное уравнение будет иметь следующий вид: ρ 2m (1.6.9) ∆ψ + 2 (ε − U (r ) )ψ = 0 , η
38
где ∆ – оператор Лапласа, ∂2 ∂2 ∂2 + + . ∂x 2 ∂y 2 ∂z 2 Перейдем к формулировке нестационарного уравнения Шредингера. Так как волновая функция свободного электрона ∆=
ψ = ψ 0e
i − ( εt − px ) η ,
то i
или
− ( εt − px ) ∂ψ i i = − εψ 0e η = − εψ η η ∂t
iη
Из (1.6.9) находим εψ :
∂ψ = εψ. ∂t
(1.6.10)
ρ η2 ∆ψ + U ( r )ψ 2m Тогда с учетом (1.6.10) имеем: ρ ∂ψ η2 (1.6.11) iη =− ∆ψ + U (r )ψ, ∂t 2m Уравнение (1.6.11) – нестационарное уравнение Шредингера. Запишем его в иной форме: ρ⎞ ∂ψ ⎛ η2 (1.6.12) iη = ⎜⎜ − ∆ + U (r ) ⎟⎟ψ. ∂t ⎝ 2m ⎠ В квантовой механике каждой физической величине соответствует свой оператор. При этом для операторов физических величин в квантовой механике обычно сохраняются соотношения, характерные для самих величин в классической механике. В уравнении (1.6.12) выражение в круглых скобках есть математическая операция, она называется оператором Гамильтона: η2 (1.6.13) Hˆ = − ∆ + uˆ , 2m uˆ = U (rρ) – оператор потенциальной энергии. Тогда нестационарное уравнение Шредингера в операторной форме записи: ∂ψ (1.6.14) iη = Hˆ ψ. ∂t Из (1.6.10) и (1.6.14) получаем стационарное уравнение Шредингера в операторной форме записи: εψ = −
39
Hˆ ψ = εψ,
(1.6.15)
где ε – собственное значение, ψ – собственная функция оператора H . Введем оператор импульса для трех его проекций. Так как i − ( εt − px ) ∂ψ i i η = p x ψ 0e = p x ψ, ∂x η η то ∂ ∂ ⎞ ⎛ ⎜ − iη ⎟ψ = p x ψ; p x ψ = p x ψ, p x = −iη . ∂x ∂x ⎠ ⎝ Аналогично получаем ∂ ρ ∂ ρ ∂ ρ ∂ ρ ∂ j + k, p y = −iη , p z = −iη , p = −iη∇, ∇ = i + ∂z ∂x ∂y ∂z ∂y
ρ
где p – оператор импульса. Кинетическая энергия электрона p2 1 ρ ρ ( p ⋅ p ), K= = 2m 2m а ее оператор 1 η2 Kˆ = − η2∇∇ = − ∆, ∆ = ∇ ⋅ ∇. 2m 2m Тогда с учетом (1.6.13) оператор Гамильтона ˆ. Hˆ = Kˆ + u Если оператор физической величины имеет собственное значение, т.е. в результате действия оператора на волновую функцию перед ней в качестве коэффициента появляется некоторая вещественная физическая величина (импульс, полная энергия и др.), то такой оператор называется эрмитовым, коэффициент перед волновой функцией называется собственным значением оператора, а сама волновая функция – собственной функцией оператора. Средние значения физических величин можно вычислить только при использовании эрмитовых операторов. Например,
(
)
V
ε = ∫ ψ*n Hˆ ψ n dV = n Hˆ n . 0
В общем случае, оператор, действующий на волновую функцию ψ , обозначим L . Тогда Lˆ ψ = Lψ, где L – собственное значение оператора (число), ψ – собственная
функция оператора Lˆ .
40
1.7. Электрон в потенциальной яме
Задача о движении электрона в потенциальной яме представляет большой интерес с познавательной точки зрения, поскольку потенциальная яма является первым приближением к модели того силового поля, которое удерживает электроны в атоме, в твердом теле. Конечно, реальная задача всегда намного сложнее той, которую мы будем рассматривать здесь. Тем не менее, общие закономерности, которые нами будут установлены, в общих чертах проявляются и в реальных условиях, т.е. отражают реально существующие в природе физические закономерности. Прежде всего, что называется потенциальной ямой? Потенциальной ямой называется зависимость потенциальной энергии микрочастицы от ее координаты, имеющая минимум. Если в потенциальной яме находится частица и ее полная энергия равна ε , то в процессе движения она в основном будет находиться в пределах потенциальной ямы. При этом частица будет испытывать непрерывные столкновения с ее стенкой, т.е. при таком движении в пространстве возникает некий колебательный процесс. Рассматриваемый здесь вопрос о движении электрона в потенциальной яме является важнейшим из тех, что изучались нами до сих пор. В самом деле, нам потребуются результаты анализа законов движения электрона в потенциальной яме при изложении физики твердого тела, в частности, физики полупроводников, при изложении физики атомов, молекул, при изложении физики атомного ядра. Итак, область применения результатов такого анализа оказывается весьма обширной. Кроме того, результаты рассматриваемой теории позволят предсказать новое физическое явление, которое имеет необычное, парадоксальное проявление, которое даже противоречит "здравому" физическому смыслу, но, тем не менее, оно наблюдается в природе и даже нашло практическое применение. Здесь имеются в виду так называемые барьерные эффекты на границе потенциальных ям, в частности, туннельный эффект. Любая одномерная потенциальная яма характеризуется двумя основными параметрами: функциональной зависимостью потенциальной энергии от координаты U = U (x) и шириной потенциальной ямы l . Оказывается, этих данных вполне достаточно для описания в ней движения электронов на основе решения уравнения Шредингера. Так как точный контур реальной ямы всегда оказывается достаточно сложным, а во многих случаях даже и неизвестным, то для решения
41
задачи реальную модель потенциальной ямы заменим ее упрощенной зависимостью U(x), имеющей вид прямоугольной потенциальной ямы. В этом случае можно решить уравнение Шредингера, причем решения получаются достаточно простыми и аналитическими, и, что в данном случае особенно важно, они достаточно хорошо соответствуют опыту. 1.7.1. Линейный гармонический осциллятор Осциллятором называется любая совершающая колебания физическая система. Если колебания совершаются по гармоническому закону, то осциллятор называется гармоническим. Различают классический и квантовый осцилляторы. Классическим осциллятором называют любую механическую систему, совершающую колебания около положения равновесия в соответствии с законами классической механики. Понятие осциллятора применяется также и к немеханическим колебательным системам, например, к колебаниям электронов в атомах, в твердом теле и т. д. Квантовым осциллятором называется система колеблющихся частиц, движение которых подчиняется квантовым законам. а) Классический осциллятор В качестве примера рассмотрим гармонический осциллятор в виде груза, подвешенного на пружине (рис. 1.7.1.1).
ρ0 i ρ Fу
х0
ρ FТ
х1
x Рис. 1.7.1.1. Пружинный гармонический осциллятор
42
Пусть x0 – координата центра тяжести груза в положении равновесия, x1 – координата в момент времени t. Тогда отклонение от положения равновесия в любой момент времени будет x = x1 − x0 . Как следует из рис. 1.7.1.1, на груз массой m будут действовать сила упруρ ρ гости Fу и сила тяжести FТ . Если отклонение от положения равновесия груза незначительно, то ρ ρ (1.7.1.1) Fy = −kxi , где x – отклонение от положения равновесия, k – коэффициент упруρ гой силы, i – единичный направляющий вектор. Сила тяжести груза равна ρ ρ FT = mg i , где m – масса груза. Груз, выведенный из положения равновесия, будет совершать колебания относительно положения равновесия. В отсутствии действия сил трения и сил сопротивления среды колебания будут незатухающими. Так как сила Fy консервативна, то ρ dU ρ (1.7.1.2) i, Fy = − dx где U – потенциальная энергия сжатой или растянутой пружины. В уравнениях (1.7.1.1) и (1.7.1.2) левые части равенства одинаковы, поэтому (1.7.1.3) dU = kxdx. . После интегрирования (1.7.1.3) получаем: kx 2 . (1.7.1.4) U= 2 Так как груз совершает колебательные движения, то в любой момент времени под действием этих сил груз перемещается с ускорениx&. По второму закону Ньютона произведение массы на ускорение ем & равно векторной сумме действующих на тело сил: ρ ρ ρ Fy + FT = m& x& i или (1.7.1.5) m& x&= − kx + mg . Решением уравнения (1.7.1.5), удовлетворяющим начальному условию x=x0 при t=0, является выражение
43
x=
( (
)
)
1 g + ω02 x0 − g cos ω0t , 2 ω0
(1.7.1.6)
где ω 02 = k , ω 0 - собственная круговая частота колебаний. m Из (1.7.1.4) следует, что потенциальная энергия меняется по параболическому закону, а так как полная энергия в процессе движения постоянна, то и зависимость кинетической энергии от координаты также меняется по параболическому закону, хотя во времени кинетическая энергия при выбранных начальных условиях меняется по закону, пропорциональному sin 2 ω0 t . Рассмотрим теперь движение электрона в атоме водорода, находящегося в основном (невозбужденном) состоянии. Находясь в этом состоянии, электрон вращается вокруг ядра, с наибольшей вероятностью двигаясь по сферической поверхности. Если теперь провести сечение поверхности, то движение электрона можно рассматривать как движение по окружности (рис. 1.7.1.2). в центре ядра, то в процесТак как начало координат находится ρ се движения радиус-вектор r электрона будет непрерывно вращаться. Система отсчета, связанная с электроном, является неинерциальной. Запишем второй закон Ньютоны в неинерциальной системе отсчета: ρ ρ ρ (1.7.1.7) ma = F + Fи , где ρ ρ ρ r q2 ρ ρ 2 ρ F = m ω r e , e = ; F =− e 0 r r r, u r 4πε0 r 2 r – расстояние между электрономρ и ядром в атоме водорода, находящегося в основном состоянии, Fu – центробежная сила инерции, a -
ρ
ускорение электрона в собственной системе отсчета, равное нулю, e r – единичный направляющий вектор. После подстановки найденных значений в (1.7.1.7) получаем: q2 − + mω02 r = 0. 4πε0 r 2
44
ϖ
υ
ρ r
q>0
ρ F
q<0
m
Рис. 1.7.1.2. Модель кругового движения электрона Отсюда ω02 =
ω 1 q2 , ν 0 = 0 , T0 = ; q = e; 3 2π ν0 4πε 0 mr
(1.7.1.8)
где ν 0 – частота вращения электрона вокруг ядра, T0 – период, e – заряд электрона. После подстановки табличных значений в (1.7.1.8) имеем ν 0 = 6,56 ⋅ 1015 Гц , Т 0 = 1,5 ⋅ 10 −16 с. б). Квантовый осциллятор Особенности физических свойств квантового осциллятора изучим на примере параболической зависимости потенциальной энергии от координаты, как это имело место в классическом осцилляторе. В отличие от классической механики, в квантовой механике понятие силы отсутствует. Поэтому нецелесообразно в выражении для потенциальной энергии использовать коэффициент упругости, как коэффициент пропорциональности между силой и отклонением микрочастицы от положения равновесия. Так как k = mω02 , то после его подстановки в (1.7.1.4) получаем mω02 2 (1.7.1.9) x . 2 На рис. 1.7.1.3 приведен график потенциальной энергии микрочастицы, построенный по формуле (1.7.1.9). U=
45 n
εn ε4 3 ε3
4
2
ε2
1
ε1 ε0
0
U (x)
Рис. 1.7.1.3. Потенциальная функция и уровни энергии гармонического осциллятора В одномерном случае стационарное уравнение Шредингера ∂ 2 ψ 2m (1.7.1.10) (ε − U ( x) )ψ = 0 + ∂x 2 η2 Решениями уравнения (1.7.1.10) являются собственные волновые функции вида 2
ψ n ( x) ~ Pn ( x)e −αx ,
где n = 0, 1, 2, 3, ...; α = const ; Pn (x) – полиномы Чебышева-Эрмита. По определению, каждой собственной волновой функции ψ n ( x) соответствует собственное значение полной энергии оператора Гамильтона ε n ; можно показать, что дифференциальное уравнение (1.7.1.10) имеет решение, удовлетворяющее так называемым стандартным физическим условиям, только в том случае, если полная энергия колеблющейся микрочастицы, в частности электрона, дискретна и равна
1⎞ ⎛ ε n = ηω0 ⎜ n + ⎟. (1.7.1.11) 2⎠ ⎝ Введем новую переменную z = x α . Тогда полиномы Pn (x) имеют достаточно простое выражение, особенно при малых значениях n. В табл. 1.7.1. приводятся некоторые значения полиномов Чебышева–Эрмита ( a1 , a2 , a3 , a4 – вещественные числа). n
0
1
2
3
4
46
Pn (z )
1
a1 z
1⎞ ⎛ a2 ⎜ z 2 − ⎟ 2⎠ ⎝
3 ⎞ ⎛ a3 ⎜ z 3 − z ⎟ 2 ⎠ ⎝
3⎞ ⎛ a4 ⎜ z 4 − 3z 2 + ⎟ 4⎠ ⎝
Таблица 1.7.1. Значения полиномов Чебышева–Эрмита Как следует из (1.7.1.11), значения полной энергии квантованы (дискретны), каждое из них определяет величину полной энергии колебательного движения микрочастицы. Так как различным значениям n соответствуют определенные значения энергии колебаний, то n называется колебательным квантовым числом. На рис. 1.7.1.3 приводятся различные значения n и соответствующие им уровни колебательной энергии ε n . Существенно, что уровни гармонического осциллятора эквидистантны: ∆ε n = ηω0 . Из (1.7.1.11) следует, что наименьшему значению полной энергии соответствует n = 0 . Это значит, что микрочастицы вещества не могут находиться в состоянии покоя даже при T = 0 K . Даже при абсолютном нуле температуры они совершают непрерывные колебания. Такие колебания называются нулевыми. Их существование, также как величина нулевой энергии, является прямым следствием соотношений неопределенности Гейзенберга. В качестве примера вычислим полную энергию основного состояния электрона в атоме водорода, полученную в результате решения уравнения Шредингера (1.7.1.10), и сравним с результатом вычислений по формуле (1.7.1.11) при n = 0 . Как будет показано в дальнейшем, энергия электрона в основном состоянии (1.7.1.12) ε 0 = hcR , где h – постоянная Планка, c – скорость света в вакууме, R – постоянная Ридберга. Подставив в (1.7.1.12) табличные значения, получим ε 0 = 13,6 эВ. Тот же результат получится, если в тождество (11) подставить значения n = 0 и периода колебаний Т 0 = 1,5 ⋅ 10 −16 с , вычисленного ранее в пункте а). Аналогичный результат можно получить, используя уравнение (1.7.1.10) при рассмотрении движения иона в кристаллической решетке твердого тела. Оказывается, что и в этом случае даже при температуре абсолютного нуля ионы совершают непрерывные колебания около положения равновесия. Таким образом, в природе не существует неподвижных микрочастиц (электронов, атомов и других микрочас-
47
тиц), микрочастицы любого физического происхождения всегда, при любой температуре находятся в непрерывном движении. 1.7.2. Движение электрона в потенциальной яме с плоским дном Как уже отмечалось ранее, график зависимости потенциальной энергии U (x) от координаты x может иметь достаточно сложный вид. В частности, он может иметь вид, изображенный на рис.1.7.2.1. Но уравнение Шредингера для таких потенциальных энергий в общем случае трудно поддается расчету. Поэтому для дальнейшего анализа заменим реальную функцию U (x) ее упрощенным графическим представлением в виде потенциальной ямы с плоским дном (рис. 1.7.2.2). В этом случае уравнение Шредингера решается достаточно просто. −
ε ,u
l 2
ε
l 2
− x
ε
ρ V me
1
ε ,u
l 2
l 2
x
ρ V me
2
3
Рис. 1.7.2.1 Потенциальная яма со сложным профилем дна
1
2
3
Рис. 1.7.2.2. Потенциальная яма с плоским дном
Из рис. 1.7.2.2 видно, что в пределах потенциальной ямы dU U ( x ) = const , F = − = 0 . Следовательно, на электрон в этой области dx сила не действует, сила возникает только на границах областей 1–2 и 2–3. Таким образом, движение электрона в пределах потенциальной ямы происходит по инерции с постоянной скоростью, его кинетическая энергия К постоянна. Рассмотрим первоначально движение электрона с полной энергией ε < 0 . Все пространство разделим на три физически различных области 1, 2, 3. В областях 1 и 3: U = 0, ε = K + U < 0 , значит, кинетическая энергия получает отрицательное значение, и скорость становится мнимой величиной. И то, и другое в классической механике не имеет физического смысла и не может реализоваться. В кантовой же механике возникает своеобразная статистическая трактовка. В области 2
48
ε > U < 0 . Кинетическая энергия положительная, скорость электрона – постоянная величина. Запишем теперь нестационарное уравнение Шредингера: ∂ψ (1.7.2.1) , Hˆ ψ = iη ∂t η2 ∂ 2 Hˆ = − + U ( x). 2me ∂x 2 В нашем случае потенциальная энергия не зависит от времени, поэтому для решения (1.7.2.1) можно применить метод разделения переменных Фурье, записав волновую функцию в виде произведения двух функций, одна из которых зависит только от координаты x , другая – только от времени t : (1.7.2.2) ψ ( x, t ) = ψ ( x )ψ (t ). Найденное выражение (1.7.2.2) для волновой функции подставим в уравнение (1.7.2.1), при этом учтем, что оператор Гамильтона на временную часть волновой функции не действует: ψ (t ) Hˆ ψ ( x) = iηψ ( x ) ⋅ ψ&(t ). Разделим переменные: ψ&(t ) Hˆ ψ( x) (1.7.2.3) = iη = C1 . ψ( x) ψ(t ) Левая часть уравнения (1.7.2.3) зависит только от координаты, правая часть – только от времени. Это возможно, если каждая из частей уравнения (1.7.2.3) равна постоянной величине C1 . Итак, имеем: Hˆ ψ ( x ) = C1ψ ( x ). Но ранее было показано, что (1.7.2.4) Hˆ ψ ( x) = εψ ( x), где ε – собственное значение оператора Гамильтона. Следовательно, С1 = ε. Подставив значение С1 в (1.7.2.3), после сокращения на ψ( x) получим дифференциальное уравнение ε dψ (t ) = −i dt , ψ (t ) η решением которого является функция i − εt η e .
(1.7.2.5) ψ (t ) = ψ 0 Тогда общее решение дифференциального уравнения (1.7.2.1) с учетом условия (1.7.2.2) будет иметь вид
49 i − εt e η .
(1.7.2.6) ψ ( x, t ) = ψ ( x ) 0 Здесь постоянная интегрирования ψ0 вошла в функцию ψ( x) , это возможно, поскольку вид волновой функции ψ( x, t ) нами еще не был определен. Заметим, если U = U ( x, t ) , т.е. потенциальная энергия зависит еще от времени, то метод разделения переменных Фурье применять нельзя, и представление волновой функции в виде произведения двух волновых функций будет неправомерным. Теперь займемся координатной частью дифференциального уравнения (1.7.2.4), для чего запишем его в развернутом виде: η2 d 2 ψ ( x) − + Uψ( x) = εψ( x), 2me dx 2 d 2 ψ ( x) 2me (1.7.2.7) + 2 (ε − U )ψ ( x) = 0, dx 2 η Уравнение (1.7.2.7) – стационарное уравнение Шредингера. Применим его для различных областей пространства. Для простоты дальнейших вычислений введем новые обозначения: 2m 2m (1.7.2.8) a12 = − 2e ε > 0, a22 = 2e (ε − U ). η η Тогда в новых обозначениях дифференциальное уравнение (1.7.2.7) в различных областях пространства будет иметь разный вид. В области 1 ψ1′′( x) − a12ψ1 ( x) = 0. Его решение l ψ1 ( x ) = ψ 01e a x + ψ 02 e − a x , x ≤ − . 2 Так как электрон в область 1 глубоко проникнуть не может, то ψ1 ( x) x = −∞ = 0, ψ 02 = 0; 1
1
ψ1 ( x) = ψ01eia1x .
(1.7.2.9)
В области 2 ψ′2′ ( x) + a22ψ 2 ( x) = 0.
Его решение ψ 2 ( x) = ψ 03e ia 2 x + ψ 04 e − ia 2 x .
В области 3 ψ′3′ ( x ) − a12 ψ 3 ( x) = 0.
Его решение
(1.7.2.10)
50
l x≥ . 2
ψ 3 ( x) = ψ 05e a1 x + ψ 06 e − a1 x ,
Так как электрон и в область 3 глубоко проникнуть не может, то ψ3 ( x) x = ∞ = 0, ψ 05 = 0; или (1.7.2.11) ψ 3 ( x ) = ψ 06 e − a1x . После подстановки в (1.7.2.6) найденных решений (1.7.2.9)– (1.7.2.11) получим волновые функции для различных областей пространства: ψ1 ( x, t ) = ψ 01e ψ 2 ( x, t ) = ψ 03e
−
−
i (εt + iηa1 x ) η ,
i (εt − ηa 2 x ) η −
+ ψ 04 e i
−
i (εt + ηa 2 x ) η ,
(εt − iηa1 x )
ψ 3 ( x, t ) = ψ 06 e η , Из анализа вида волновых функций следует, что в 1-й и 3-й областях фазовые скорости имеют мнимую величину, хотя сами волновые функции отличны от нуля. Это означает, что квантовая механика предсказывает возможность прохождения через потенциальный барьер, но не объясняет физическую природу возможности прохождения. Парадоксальность ситуации состоит в том, что в этом случае нарушается закон сохранения энергии. В области 2 фазовая скорость – вещественная величина, волновая функция состоит из двух плоских волн, распространяющихся в противоположных направлениях. Для определения постоянных интегрирования ψ01, ψ03, ψ04, ψ06 воспользуемся граничными условиями для волновых функций и их производных: ⎛ ψ 2 ( x ) = ψ3 ( x ) ⎞ ⎛ ψ1 ( x) = ψ 2 ( x) ⎞ . (1.7.2.12) ⎟⎟ ⎜⎜ ⎟⎟ ; ⎜⎜ x x ψ ' ( x ) ψ ' ( x ) = = ψ ' ( ) ψ ' ( ) 2 3 ⎝ 1 ⎠ x =l / 2 ⎝ 2 ⎠ x =l / 2
После подстановки значений в граничные условия решений соответствующих дифференциальных уравнений находим постоянные интегрирования, при этом в зависимости от четности волновой функции в области 2 получаем различные постоянные интегрирования. Кроме того, в зависимости от четности волновой функции получаем различные уравнения, определяющие условия квантования полной энергии электрона: для четной волновой функции в области 2 al a1 = a2 tg 2 , 2
51
для нечетной волновой функции в области 2 al a2 = − a2 ctg 2 . 2 В дальнейшем для анализа будем использовать только четную волновую функцию. В результате проведенных преобразований получаем следующие выражения для волновых функций в областях 1, 2, 3: ψ1 ( x) = ψ 0 e ψ 2 ( x) =
l a1 ( x + ) 2
,
ψ0 ⋅ cos a2 x , al cos 2 2 l − a1 ( x − ) 2
l −∞ ≤ x ≤ − ; 2 l l − ≤x≤ ; 2 2
(1.7.2.13)
l ≤ x ≤ ∞. 2 Для определения постоянной ψ0 воспользуемся условием нормировки волновой функции: ψ 3 ( x) = ψ 0 e
−
l 2
∫e
l 2 a1 ( x + ) 2
−∞
dx +
l 2
∫ −
Отсюда имеем:
l 2
,
∞
l − 2 a1 ( x − ) cos 2 (a2 x) 2 dx + ∫ e dx = ψ 0− 2 a l l cos 2 ( 2 ) 2 2 −1
2 ⎛a ⎞ 2⎛ 2 2a ⎞ (1.7.2.14) ψ = ⎜ + 1 + ⎜⎜ 1 ⎟⎟ + 2 1 ⎟ . l ⎜ a1l a2 ⎠ a2 l ⎟ ⎝ ⎝ ⎠ Из решений (1.7.2.13) видно: если электрон находится в области 2, то всегда существует некоторая вероятность проникновения вглубь стенки потенциальной ямы, хотя по законам классической физики это невозможно. Рассмотрим более подробно причину квантования полной энергии электрона, находящегося в потенциальной яме конечной глубины. Из (1.7.2.8) следует, что величина полной энергии ε электрона в области 2 η2 2 (1.7.2.15) ε =U + a2 . 2me Следовательно, возможные значения полной энергии определяются возможными значениями параметра a2 и величиной потенциальной энергии U, причем 2m (1.7.2.16) a22 + a12 = − 2 e U . η 2 0
52
После подстановки в (1.7.2.16) значений a1 и a2 из (1.7.2.8) и последующих преобразований получаем трансцендентное уравнение 2m ⎛a l⎞ (1.7.2.17) a22 = − 2 e U cos 2 ⎜ 2 ⎟. η ⎝ 2 ⎠ В табл. 2 приведены значения a2 для различных значений n. Знание корней a2 позволяет по формуле (1.7.2.15) вычислить полную энергию электрона в потенциальной яме. С целью определения возможных значений полной энергии электрона в качестве примера, используя (1.7.2.16) и (1.7.2.17), выполним конкретный расчет при следующих исходных условиях: l = 2 нм, U = -10 эВ. Результаты вычислений представлены в табл. 1.7.2, в которой n – квантовое число. n
a2·10
9
- ε , эВ
1 1,48
2 3 1,67 4,44
4 5,03
5 7,38
9,92
9,89 9,25
9,04
7,92
6 7 8,40 10,3 5,9 7,33 5
8 13,2
9 15,9
3,37
0,35
Таблица 1.7.2. Результаты вычислений по (1.7.2.16) и (1.7.2.17) На рис. 1.7.2.3 изображена потенциальная яма и расположение уровней полной энергии при заданных параметрах a2 и U. Разумеется, при иных параметрах потенциальной ямы число и расположение уровней полных энергий в ней будет иным. Если глубина потенциальной ямы при заданной ее ширине l невелика, то число уровней в ней ограничено, и электрон в потенциальной яме по-прежнему обладает дискретными значениями полной энергии. Но чем больше ширина потенциальной ямы, тем большее число уровней будет находиться в ней, что непосредственно следует из решений уравнений. Если же провести подобный расчет для макроскопического тела (металла), то окажется, что число уровней в нем станет настолько большим, а энергетический интервал между соседними уровнями будет настолько мал, что отдельные уровни окажутся физически неразличимыми. Таким образом, в металле возникнет зона разрешенных значений энергии. И если она, допустим, частично заполнена, то такая зона разрешенных значений энергии называется зоной проводимости.
53 ε ,u
n
-10
0
10
ο
x,
A
9
8
ε 7 6 5 4 3
Рис. 1.7.2.3. Потенциальная функция и уровни энергии частицы в потенциальной яме с плоским дном Итак, чем больше l, тем больше будет квантовых чисел n, тем большее число волновых функций будут описывать движение электронов в потенциальной яме, поскольку каждой волновой функции должно соответствовать собственное значение полной энергии. В нашем примере число волновых функций 9. Ψ 2 (x) n=1 n=2 n=3 x, A -1.0
1.0
Рис. 1.7.2.4. Графики плотности вероятности для частицы в потенциальной яме
54
На рис. 1.7.2.4 изображены графики плотности вероятностей для первых трех квантовых чисел. Из рис. 1.7.2.4 видно, что с ростом n понижается высота максимума плотности вероятности, кроме того, число максимумов для заданного n равно числу n. Если ширина потенциальной ямы достаточно велика, то n будет велико, и для электрона, обладающего достаточно большой энергией, число максимумов будет столь велико, что они окажутся физически неразличимыми. Таким образом, в этом случае положение электрона можно определить лишь с точностью до ширины потенциальной ямы. Электрон теперь как бы "размазан" по всей ширине потенциальной ямы. 1.7.3. Движение электрона над потенциальной ямой Пусть энергия электрона ε > 0. Тогда при движении на его пути не встречается потенциальный барьер (рис. 1.7.3.1). Классическая механика показывает, что никаких препятствий для движения частицы в прямом направлении не возникает, отражение от потенциального барьера не происходит. Рассмотрим ту же задачу, применив для ее решения уравнение Шредингера ∂ψ (1.7.3.1) Hˆ ψ = i η . ∂t ε U ρ v
ε
m e
l
x
0
I
II
III
Рис. 1.7.2.5. Схема движения электрона над потенциальной ямой
55
Его решение представим в виде произведения двух волновых функций: (1.7.3.2) ψ( x, t ) = ψ(x ) ψ(t ), где i − εt
ψ (t ) = ψ 0 e η . Запишем стационарное уравнение Шредингера 2m (1.7.3.3) ψ ′′( x ) + 2e (ε − U ) ψ ( x ) = 0 . η Так как всюду полная энергия ε > 0, то решения уравнения (3) будут отличаться от полученных в п. 1.7.2. Как и раньше, все геометрическое пространство разделим на три области. В областях 1 и 3 2m U = 0, a12 = 2e ε > 0 . η В области 2 2m U < 0, a22 = 2e (ε − U ) > 0 . η Решениями уравнения (3) будут: в области 1 ψ1(x) = ψ01eia1x + ψ02e−ia1x , i − (ε t−ηa1x) η ψ1(x,t) = ψ01e +
i − (ε t+ηa1x) η ψ02e ;
в области 2 ψ 2 ( x) = ψ 03e ia 2 x + ψ 04 e −ia 2 x , ψ 2 ( x, t ) = ψ 03
i − ( ε t − ηa 2 x ) η e
+
ψ 04
i − ( ε t + ηa 2 x ) η e ;
в области 3 ψ 3 ( x) = ψ 05eia1 x + ψ 06 e −ia1 x , i − ( ε t − ηa1 x ) η e
i − ( ε t + ηa1 x ) η e ;
ψ 3 ( x, t ) = ψ 05 + ψ 06 Из полученных решений видно, что каждое из них содержит прямую и отраженную волну. Но так как в области 3 нет физических условий для возникновения отраженной волны при движении электрона в прямом направлении, то естественно положить ψ06 = 0. Коэффициенты отражения и прохождения можно выразить через отношения соответствующих значений плотности вероятности:
56 2
2
⎛ψ ⎞ ⎛ψ ⎞ (1.7.3.4) R = ⎜⎜ 02 ⎟⎟ , D = ⎜⎜ 05 ⎟⎟ . ψ ⎝ 01 ⎠ ⎝ ψ 01 ⎠ Для определения постоянных интегрирования ψ01 ,ψ02 ,ψ05 используем граничные условия, согласно которым на границе раздела соседних областей пространства должны быть равны не только волновые функции, но и их первые производные: ψ 01 + ψ 02 = ψ 03 + ψ 04 ⎛ ψ1 ( x) = ψ 2 ( x) ⎞ ⎟⎟ ; ⎜⎜ ⎝ ψ1 ' ( x) = ψ 2 ' ( x) ⎠ x = 0 ia1 (ψ 01 − ψ 02 ) = ia2 (ψ 03 − ψ 04 ) (1.7.3.6) ⎛ ψ 2 ( x ) = ψ 3 ( x) ⎞ ψ 03eia 2 l + ψ 02e − ia 2 l = ψ 05eia 2 l ⎜⎜ ⎟⎟ ; ia l − ia l ia l ⎝ ψ 2 ' ( x) = ψ 3 ' ( x) ⎠ x = l ia2 ψ 03e 2 − ψ 04e 2 = ia1ψ 05e 2
(
)
Для вычисления R и D необходимо знать Ψ01 ,Ψ02 ,Ψ05. Их значения можно найти из совместного решения системы уравнений (1.7.3.5): ⎛ i (a 2 + a22 ) sin a2l ⎞ ⎟⎟ ψ 01 , ∆ = 4e ia1l ⎜⎜ cos a2l − 1 2a1a2 ⎝ ⎠ ∆ψ 02 = ψ 01
(
)
,
ψ 05 =
2eia1l i a22 − a12 sin a2l , a1a2
∆ψ 05 = ψ 01 ⋅ 4 .
Тогда ψ 02 =
∆ψ 02 ∆
∆ψ 05 ∆
(1.7.3.6)
где ∆, ∆ψ02 , ∆ψ05 – значения соответствующих определителей системы уравнений. Значения из (1.7.3.6) подставляем в (1.7.3.4). В результате получаем: 2
R=
⎛ ⎛ a ⎞2 ⎞ ⎜ ⎜ 2 ⎟ − 1⎟ sin 2 a l 2 ⎜ ⎜⎝ a1 ⎟⎠ ⎟ ⎝ ⎠ 2
⎞ ⎛ a ⎞ ⎛⎛ a ⎞ 4⎜⎜ 2 ⎟⎟ + ⎜ ⎜⎜ 2 ⎟⎟ − 1⎟ sin 2 a2l ⎟ ⎝ a1 ⎠ ⎜⎝ ⎝ a1 ⎠ ⎠
D=
2
2
⎛a ⎞ 4 ⎜⎜ 2 ⎟⎟ ⎝ a1 ⎠ 2
(1.7.3.7)
.
(1.7.3.8)
2
2
⎞ ⎛ a ⎞ ⎛⎛ a ⎞ 4⎜⎜ 2 ⎟⎟ + ⎜ ⎜⎜ 2 ⎟⎟ − 1⎟ sin 2 a2l ⎟ ⎝ a1 ⎠ ⎜⎝ ⎝ a1 ⎠ ⎠ 2
,
57
Из (1.7.3.7) следует, что существует определенная вероятность отражения электрона от правой границы потенциальной ямы, что не имеет места в классической физике. Электрон, пролетая над потенциальной ямой, как бы "чувствует" ее влияние, что и приводит к возникновению некоторой вероятности отражения от нее. Рассмотрим конкретный пример. Пусть U= -10 эВ, ε = 5 эВ, l=2нм. Расчет, выполненный по формулам (1.7.3.7) и (1.7.3.8), дает следующие результаты: R = 0,22, D = 0,78. Из формулы (1.7.3.7) следует, что при sin a2l = 0 коэффициент отражения R = 0. Следовательно, условие a2l = κπ соответствует условию квантования полной энергии электрона: h2 ε = U + κ2 , (1.7.3.9) 8mel 2 κ = 1, 2, 3, ... Условие (1.7.3.9) накладывает определенные ограничения на величину полной энергии. Если электрон, пролетая над потенциальной ямой, не чувствует ее влияния, sin a2l = 0, R = 0, то его полная энергия должна быть дискретна, т.е. квантована. 1.7.4. Движение электрона над потенциальным барьером Пусть на пути движения электрона расположен потенциальный барьер бесконечно большой толщины. Полная энергия электрона всюду больше потенциальной, ε > U0 > 0 (рис. 1). Рассмотрим влияние такого потенциального барьера на движений электрона. Для этого все пространство разобьем на две области. В области 1 U = 0, в области 2 U=const. ε U ρ v
ε
m e II
I
0
x
Рис. 1.7.4.1. Схема движения электрона над потенциальным барьером
58
Для каждой из областей пространства запишем стационарное уравнение Шредингера. Область 1 (1.7.4.1) ψ1′′( x) + a12ψ1 ( x) = 0 . Область 2 (1.7.4.2) ψ ′2′ ( x) + a22 ψ 2 ( x ) = 0 , где 2m 2m a12 = 2e ε, a22 = 2e (ε − U ) . η η Решениями дифференциальных уравнений (1.7.4.1) и (1.7.4.2) являются (1.7.4.3) ψ1 ( x) = ψ 01eia1 x + ψ 02e −ia1 x , (1.7.4.4) ψ 2 ( x) = ψ 03eia1 x + ψ 04e −ia1 x . Тогда с учетом временной составляющей волновой функции получаем: для области 1 ψ1 ( x, t ) =
i − ( ε t − ηa1 x ) η ψ 01e
+ ψ 02
i − ( ε t + ηa1 x ) η e ,
(1.7.4.5)
ψ1 ( x, t ) = ψ1пад ( x, t ) + ψ1отр ( x, t ) .
для области 2 ψ 2 ( x, t ) = ψ 03
i − ( ε t − ηa 2 x ) η e
+ ψ 04
i − ( ε t + ηa 2 x ) η e ,
(1.7.4.6)
ψ 2 ( x, t ) = ψ 2 пад ( x, t ) + ψ 2отр ( x, t ) . где ψ1пад( x ,t), ψ2пад( x ,t), ψ1отр( x ,t), ψ2отр( x ,t) – соответственно падающая и отраженная волны де Бройля. Из постановки задачи следует, что в области 2 отраженная волна возникать не может, поэтому ψ 2отр ( x, t ) = 0 , ψ 04 = 0 . Тогда волновая функция в области 2 будет иметь вид: i − ( ε t − ηa 2 x )
(1.7.4.7) ψ 2 ( x, t ) = ψ 03e η . Для определения постоянных интегрирования ψ01, ψ02, ψ03 запишем граничные условия для уравнений (1.7.4.5) и (1.7.4.7)? ⎛ ψ1 ( x ) = ψ 2 ( x ) ⎞ ⎜⎜ ⎟⎟ . ⎝ ψ1′ ( x) = ψ′2 ( x) ⎠ x =0 Тогда после подстановки соответствующих значений в граничные условия имеем:
59
ψ 01 + ψ 02 = ψ 03
⎫ (1.7.4.8) ⎬. a1ψ 01 − a1ψ 02 = a2 ψ 03 ⎭ Решив систему уравнений (1.7.4.8) совместно, получим a −a 2a1 (1.7.4.9) ψ 02 = 1 2 ψ 01 , ψ 03 = ψ 01. a1 + a2 a1 + a2 При движении в пространстве электрон обладает импульсом p=ħa1,2 . Поэтому p1 = ηa1 , p2 = ηa2 . Так как при движении электрона в пространстве вместе с ним переносится импульс, то плотность вероятности переноса импульса в области 1: в прямом направлении 2 2 , ω2 пад = p1ψ 01 = ηa1ψ 01 в обратном направлении 2 2 ω2обр = p1ψ 02 = ηa1ψ 02 Плотность вероятности переноса импульса в области 2 2 2 . ω2пад = p1ψ 03 = ηa1ψ 03 По определению, коэффициент отражения электрона от потенциального барьера ω1отр
⎛ψ ⎞ = ⎜⎜ 02 ⎟⎟ ω2пад ⎝ ψ 02 ⎠ коэффициент прохождения в область 2 R=
2
,
(1.7.5.10)
2
ω2 пад a2 ⎛ ψ 03 ⎞ . (1.7.5.11) ⎟ = ⎜ ω1пад a1 ⎜⎝ ψ 01 ⎟⎠ Подставив в (1.7.5.10) и (1.7.5.11) найденные в (1.7.5.9) значения, получим D=
2
⎛a −a ⎞ 4a1a2 , (1.7.5.12) R = ⎜⎜ 2 1 ⎟⎟ , D = 2 + a a ( ) a + a ⎝ 2 1⎠ 2 1 причем, как видно из (11) и (12), R + D = 1. Рассмотрим конкретный пример. Пусть ε = 10 эВ, U = 5эВ. После вычислений по (1.7.5.12) имеем: R = 0, 0294, D = 0, 9706. Если же ε = 10 эВ, U = 9 эВ, то R = 0,270, D = 0,730, т.е. с увеличением высоты потенциального барьера коэффициент отражения возрастает, и при условии U0≥ε электрон потенциальный барьер преодолеть не может.
60
В заключение сделаем следующее замечание. В настоящем параграфе рассматривалось движение электрона с использованием плотности вероятности переноса импульса. Этот подход к решению задачи является более общим по сравнению с решениями в разделах 1.7.2 и 1.7.3. Может возникнуть вопрос: "Почему же в тех разделах был получен физически правильный результат?" Причина заключается в том, что потенциальная энергия электрона в 1-ой и 3-ей областях пространства там была одинаковой, поэтому импульсы электрона в областях 1 и 3 также одинаковы: p1 = ηa1 , p2 = ηa2 . В результате при вычислении коэффициентов отражения и прохождения импульсы электрона сокращаются. Но если потенциальные энергии в областях 1 и 3 разные, то следует вычислять плотности вероятности переноса импульсов как в прямом, так и в обратном направлениях. 1.7.5. Движение электрона в направлении потенциального барьера конечной толщины Пусть на пути движения свободного электрона находится потенциальный барьер высотой U конечной толщины l. Полная энергия электрона ε < U (рис. 1.7.5.1) Как и ранее, все координатное пространство разделим на три области. В областях 1 и 3 потенциальная энергия электрона U = 0, в области 2 U > ε > 0. Вычислим коэффициент отражения электрона R от потенциального барьера и коэффициент прохождения электрона D сквозь потенциальный барьер. Запишем уравнение Шредингера и их решения для каждой из областей в отдельности. Область 1: (1.7.5.1) ψ1'' + a12 ψ1 ( x) = 0 . Решение дифференциального уравнения ψ1 ( x) = ψ 01e ia1 x + ψ 02 e −ia1 x , ψ1 ( x, t ) = ψ 01e
i − ( ε t − ηa1 x ) η
где a12 =
2me ε > 0. η2
+ ψ 02 e
i − ( ε t + ηa1 x ) η
,
61
ε U
vρ m
0
vρ
ε m
e I
II
e
III
0
λ
Рис. 1.7.5.1. Схема движения электрона к барьеру конечной ширины Область 2: (1.7.5.2) ψ '2' + a22ψ 2 ( x) = 0 . Решение дифференциального уравнения ψ 2 ( x) = ψ 03eia2 x + ψ 04e −ia2 x = ψ 03e a3x + ψ 04 e − a3x , где 2m 2m a22 = 2e (ε − U 0 ) < 0, a2 = ia3 , a32 = 2e (U − ε) > 0. η η Так как ширина потенциального барьера может быть достаточно большой, то при ψ03 ≠ 0 первое слагаемое с ростом может неограниченно возрастать, что не имеет физического смысла. Для исключения этого противоречия необходимо положить ψ03 = 0. Тогда решением дифференциального уравнения (1.7.5.2) является ψ 2 ( x ) = ψ 04 e − a3 x , (1.7.5.3) i i ψ 2 ( x, t ) = ψ 04 e
− ( ε t − iηa 3 x ) η
= ψ 04 e
− ( ε t − iηa 2 x ) η .
Область 3: ψ′3′ ( x) + a12 ψ 3 ( x ) = 0. Решение дифференциального уравнения ψ 3 ( x) = ψ 05eia1 x + ψ 06 e −ia1 x , i − ( ε t − iηa1 x ) η e
i − ( ε t + iηa1 x ) η e .
ψ 3 ( x, t ) = ψ 05 + ψ 06 Поскольку физических условий для отражения электрона в области 3 не существует, то ψ06 = 0 . Тогда
62
(1.7.5.4) ψ 3 ( x ) = ψ 05 e ia1x . Для определения амплитуд волновых функций ψ01, ψ02, ψ05 используем граничные условия: ⎛ ψ 2 ( x) = ψ 3 ( x) ⎞ ⎛ ψ1 ( x ) = ψ 2 ( x ) ⎞ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ; ′ ′ ⎝ ψ1 ( x ) = ψ 2 ( x ) ⎠ x = 0 ⎝ ψ′2 ( x) = ψ′3 ( x) ⎠ x = λ Таким образом, формально результаты вычислений в настоящем параграфе полностью совпадают с результатами вычислений в разделе 1.7.3, в котором рассматривалось движение электрона над потенциальной ямой. Различие состоит в том, что в разделе 1.7.3 a2 – действительная величина, здесь же a2 – мнимая величина. На основании этого все промежуточные вычисления можно опустить, записав сразу выражения для R и D, полученные в разделе 1.7.3: 2
R=
⎛ ⎛ a ⎞2 ⎞ ⎜ ⎜ 2 ⎟ − 1⎟ sin 2 a l 2 ⎜ ⎜⎝ a1 ⎟⎠ ⎟ ⎝ ⎠ 2
⎞ ⎛ a ⎞ ⎛⎛ a ⎞ 4⎜⎜ 2 ⎟⎟ + ⎜ ⎜⎜ 2 ⎟⎟ − 1⎟ sin 2 a2l ⎟ ⎝ a1 ⎠ ⎜⎝ ⎝ a1 ⎠ ⎠ 2
2
⎛a ⎞ 4 ⎜⎜ 2 ⎟⎟ ⎝ a1 ⎠
D=
,
(1.7.5.5)
.
(1.7.5.6)
2
2
⎞ ⎛ a ⎞ ⎛⎛ a ⎞ 4⎜⎜ 2 ⎟⎟ + ⎜ ⎜⎜ 2 ⎟⎟ − 1⎟ sin 2 a2l ⎟ ⎝ a1 ⎠ ⎜⎝ ⎝ a1 ⎠ ⎠ Так как a2 = ia3 – мнимая величина, то e a 3l − e − a3l sin( a2l ) = sin(ia3l ) = sh ( a3l ) = . 2 Найденное выражение для подставим в (1.7.5.5) и (1.7.5.6): 2
2
2
R=
⎛ ⎛ a ⎞2 ⎞ ⎜ ⎜ 3 ⎟ − 1⎟ sh 2 (a l ) 3 ⎜ ⎜⎝ a1 ⎟⎠ ⎟ ⎝ ⎠ 2
⎞ ⎛ a ⎞ ⎛⎛ a ⎞ 4⎜⎜ 3 ⎟⎟ + ⎜ ⎜⎜ 3 ⎟⎟ − 1⎟ sh 2 (a3l ) ⎟ ⎝ a1 ⎠ ⎜⎝ ⎝ a1 ⎠ ⎠ 2
2
,
(1.7.5.7)
63 2
⎛a ⎞ 4 ⎜⎜ 2 ⎟⎟ . (1.7.5.8) ⎝ a1 ⎠ D= 2 2 2 ⎞ ⎛ a ⎞ ⎛⎛ a ⎞ 4⎜⎜ 2 ⎟⎟ + ⎜ ⎜⎜ 2 ⎟⎟ − 1⎟ sh 2 a2l ⎟ ⎝ a1 ⎠ ⎜⎝ ⎝ a1 ⎠ ⎠ Выражение для коэффициента прохождения электрона через барьер может быть представлено в виде ⎛ 2 ⎞ D = D0 exp⎜ − 2me (U 0 − ε) ⋅ l ⎟ ⎝ η ⎠ где величина D0 близка к единице. При этом R=1-D. Из физического смысла формул (1.7.5.7) и (1.7.5.8) следует, что здесь отсутствуют условия квантования, причина состоит в том, что sh(a3l) не является периодической функцией. Следовательно, при любых значениях ε, U, l имеется определенная вероятность для электрона преодолеть потенциальный барьер без изменения полной энергии; электрон, сталкиваясь с потенциальным барьером, с определенной вероятностью может пройти через него как через туннель. Поэтому это явление, этот эффект еще называется туннельным эффектом. Опыт подтверждает предсказание теории. Оценим теперь вероятность туннельного эффекта для слоев различной толщины. Расчет выполним для U = 5 эВ и двух значений полной энергии: 3 эВ и 4, 8 эВ. Результаты вычислений по формулам (1.7.5.7) и (1.7.5.8) сведены в табл. 1.7.3.
ε, эВ
R
D
l, A
l, A
0,1
0,2
0,3
0,4
0,1
0,2
0,3
0,4
3
0,395
0,810
0,952
0,989
0,605
0,190
0,048
0,011
4,8
0,259
0,596
0,783
0,879
0,741
0,404
0,217
0,121
Таблица 1.7.3. Вероятность туннельного эффекта для слоев различной толщины Как следует из табл. 1.7.3, туннельный эффект может проявляться лишь на расстояниях, сравнимых с размерами атомов. В последние годы туннельный эффект неожиданно нашел практическое применение: на основе использования этого эффекта были разработаны и успешно применяются туннельные микроскопы, с помощью которых
64
можно исследовать и визуализировать изучаемую поверхность на атомно-молекулярном уровне. Для этого используется микроскопический зонд, который перемещается вдоль поверхности в непосредственной близости от нее. Регистрируемый сигнал усиливается, и на экране осциллографа или телевизора наблюдается профиль изучаемой поверхности, что, в свою очередь, является экспериментальным доказательством существования этого эффекта. На основе использования представлений о туннельном эффекте объясняются некоторые физические явления, такие как автоэлектронная эмиссия или α-распад. При помощи туннельного эффекта можно объяснить принцип работы туннельных диодов и других тонкопленочных элементов, разработанных в начале 60-х годов. Эти элементы в настоящее время промышленностью выпускаются серийно. Наконец, с помощью туннельного эффекта можно объяснить механизм проводимости тонких диспергированных пленок, ибо в очень тонких пленках толщиной в моноатомный слой механизм проводимости иной, нежели в массивном образце: там не выполняется закон Ома и наблюдается ряд особенностей, вызванных тем, что средняя длина свободного пробега электрона сравнима с расстоянием между отдельными атомными образованиями (кластерами), существующими на поверхности твердого тела. 1.7.6. Автоэлектронная эмиссия Возможность прохождения электрона или другой микрочастицы (нуклон в ядре атома, α-частица) через потенциальный барьер конечной толщины впервые получила экспериментальное подтверждение в явлении эмиссии электронов из металлов, возникающей под действием внешнего электрического поля. Это явление называется автоэлектронной эмиссией. Сущность явления следующая. Действие внешнего электрического поля напряженностью Е приводит к тому, что на границе металл– вакуум возникает потенциальный барьер конечной толщины вместо существовавшего ранее потенциального барьера бесконечно большой толщины. Этот барьер в сильных полях оказывается достаточно тонким, и электрон за счет туннельного эффекта может вылететь за пределы металла. В результате эмиссия электронов начинается при значительно меньших значениях напряженности электрического поля Е по сравнению с классической оценкой явления. Так как эта эмиссия электронов возникает при любой температуре, в том числе и комнатной, то явление называется холодной эмиссией электронов.
65
Внешнее электрическое поле в металл практически не проникает, оно лишь действует на электроны поверхностного слоя, на пути движения которых теперь расположен достаточно узкий потенциальный барьер. Поэтому имеется определенная вероятность преодолеть такой потенциальный барьер туннельным эффектом. В настоящее время явление автоэлектронной эмиссии нашло практическое применение. В частности, оно используется в электронных проекторах, у которых увеличение изображения объекта достигает величины 2·106. При таком увеличении изображения отдельных участков поверхности острия вольфрамового катода получаются такой величины, что можно отчетливо наблюдать на экране проектора поверхность кристаллической решетки, а также отдельные поверхностные атомные скопления – кластеры. Для получения большой величины напряженности электрического поля вблизи поверхности катода он должен быть очень тонким, радиус кривизны поверхности катода должен быть порядка 1 мкм. Только в этом случае можно получить сильное электрическое поле вблизи поверхности катода (рис. 1.7.6.1).
-
+
Рис. 1.7.6.1. Схема применения игольчатого катода Явление автоэлектронной эмиссии нашло широкое применение в промышленности. Речь идет о следующем. В 70-х–90-х гг. ХХ века на основе использования явления автоэлектронной эмиссии были разработаны катоды для целого ряда электронно-лучевых приборов. Использование таких катодов позволило резко увеличить ток эмиссии электронов, сделать сильноточные установки более надежными и компактными. Сильное электрическое поле позволяет туннельным эффектом вырывать электроны не только с поверхности металла и жидкости, но и из отдельных атомов и молекул. Это явление называется автоионизацией. В настоящее время явление автоионизации используется в ионных источниках масс-спектрометров. Достоинством таких источников является отсутствие у них накаленных электродов, а также отсутствие диссоциации анализируемых молекул.
66
Глава 2. ФИЗИКА АТОМОВ И МОЛЕКУЛ 2.1. Основные понятия Как известно, атом – наименьшая составная часть вещества, в которой сохраняется индивидуальность химического элемента. Сам химический элемент – это совокупность атомов одного сорта. Взаимодействие между атомами при наличии достаточно сильной связи может приводить к образованию молекул. Каждый атом состоит из положительно заряженного ядра и вращающихся вокруг него электронов. Таким образом, ядро атома окружено облаком электронов, образующих электронные оболочки. Размеры атома определяются размерами его электронной оболочки, строго говоря, не имеющей определенной границы. В нормальном состоянии атомы электрически нейтральны. Но существуют условия, при которых атом может потерять или присоединить дополнительные электроны, превращаясь соответственно в положительный или отрицательный ион. Строение электронных оболочек атома определяется электромагнитными взаимодействиями электронов оболочки с ядром и между собой. Электромагнитное взаимодействие в веществе на порядки превышает гравитационное взаимодействие, поэтому все силы, действующие между частицами и приводящие к образованию атомов, молекул, жидкого и твердого состояния вещества, имеют только электромагнитное происхождение. Попытки перенести в атомную физику понятия и законы физики макроскопических тел показали неприменимость многих понятий классической физики в физике микромира. Это можно проиллюстрировать на примере системы, состоящей из двух частиц – протона и электрона (атом водорода). В процессе движения между электроном и протоном существует электромагнитное взаимодействие. Классическое решение задачи приводит к планетарной модели атома, согласно которой электрон вокруг ядра движется по круговой или эллиптической орбите. Но согласно классической электродинамике вращающийся вокруг ядра электрон должен непрерывно излучать электромагнитные волны и при этом непрерывно терять энергию. В результате через некоторое время электрон должен упасть на ядро. Опыт не подтверждает этот теоретический результат. Решение той же задачи с использованием уравнения Шредингера приводит к результату, полностью соответствующему опыту.
67
Так как процесс решения реальных задач с использованием уравнения Шредингера – очень непростая с математической точки зрения процедура, то в квантовой механике определенные математические действия символически отображаются в виде операторов. С некоторыми из них мы познакомились ранее. Тогда на языке операторов любую сложную математическую задачу можно достаточно просто формализовать, проще проследить за отдельными этапами ее решения, легче сделать определенные физические выводы. 2.2. Оператор момента импульса Физические особенности атомов, молекул, твердых тел хорошо объясняются особенностями строения электронной оболочки отдельных атомов. Атомные электроны, образующие электронную оболочку, непрерывно находятся в движении вокруг ядра. Движение это криволинейное, и его важнейшей динамической характеристикой является ρ момент импульса L . Момент импульса в квантовой теории играет значительно более важную роль, чем в классической физике, поскольку в микромире существует деление частиц на фермионы и бозоны, коллективное поведение которых существенно различается между собой. Кроме того, с формальной точки зрения поля с различными спиновыми квантовыми числами s представляются различными математическими объектами: так, частицам, у которых s = 0, соответствует скалярная волновая функция, частицам, у которых s = 1/2, соответствует спинорная волновая функция, а частицам, у которых s = 1, соответствует векторная волновая функция. В классической механике момент импульса электрона в принципе может быть определен совершенно точно, так как никаких ограничений на точность определения координаты и импульса там не накладывается: ρ ρ ρ (2.2.1) L =r × p. В квантовой механике на одновременное определение r и p соотношениями неопределенностей накладывается определенное ограничение, а именно (2.2.2) ∆r ∆ p > h . Поэтому точное определение момента импульса, например, путем задания трех его проекций, в квантовой механике не имеет физического смысла. Тем не менее, исходя из определения момента импульса, выражение для оператора момента импульса составить можно:
68
где
ρ ρ ρ ρ ρ ρ L = r × p = ( y pz − z p y ) i + ( z px − x pz ) j + ( z p y − y pz ) k , (2.2.3) ρ ρ ρ ρ ρ ∂ ∂ ∂ rˆ = r = x i + y j + z k ; pˆ x = −i η , pˆ y = −i η , pˆ z = −i η ; ∂x ∂y ∂z ˆ ˆ ˆ (2.2.4) ypˆ z − zpˆ y = Lx , zpˆ x − xpˆ z = Ly , zpˆ y − ypˆ z = Lz .
Используя результаты (2.2.3) и (2.2.4), составим разность произведений разноименных проекций моментов импульса на координатные оси. После некоторых математических преобразований получаем следующий результат: Lˆ x Lˆ y − Lˆ y Lˆ x = i η Lˆ z ⎫ ⎪⎪ (2.2.5) Lˆ x Lˆ z − Lˆ z Lˆ x = − i η Lˆ y ⎬ . ⎪ Lˆ y Lˆ z − Lˆ z Lˆ y = − i η Lˆ x ⎪⎭
ρ ˆ
Предположим, что оператор момента импульса L имеет собственное значение. Тогда ρ ρ ρ ρ ˆ L = Lˆ x i + Lˆ y j + Lˆ z k , Lˆ x ψ = Lx ψ, Lˆ y ψ = L y ψ, Lˆ z ψ = Lz ψ . Операторы (5) умножим справа на волновые функции: (2.2.6) Lˆ x ( Lˆ y ψ ) − Lˆ y ( Lˆ x ψ ) = i η Lˆ z ψ =. Но Lˆ x ( Lˆ y ψ ) = Lˆ x ( L y ψ ) = Lˆ y ( Lˆ x ψ ) = L y Lx ψ . Аналогично имеем: Lˆ y ( Lˆ x ψ ) = Lˆ y ( Lx ψ ) = Lx ( Lˆ y ψ ) = Lx L y ψ . Найденные значения подставим в (2.2.6): i η Lz ψ = ( L y Lx − Lx L y ) ψ = 0, Lz = 0. Аналогично доказывается, что Lx = Ly = 0. Таким образом, собственные значения проекций оператора момента импульса равны нулю, значит, и собственное значение оператора момента импульса также равно нулю. Физически это означает, что в ρ отсутствие действия внешнего поля оператор Lˆ в пространстве не опρ ределен, вектор L в пространстве в процессе движения может иметь любое, произвольное направление. Это эквивалентно тому, что у него нет собственного значения. Однако в определенные моменты времени его проекции на координатные оси все-таки существуют.
69
Движение электрона в атоме вокруг ядра происходит по криволинейной траектории. Поэтому для описания движения электрона в пространстве, естественно, следует использовать сферическую систему координат (рис. 2.2.1).
z ρ Lz
θ ρ Lx
ϕ
ρ L
ρ Ly
y
x Рис. 2.2.1. Сферическая система координат Запишем операторы проекций импульсов в сферической системе координат: ∂ ∂ Lˆ x = i η (sin ϕ + ctg θ cos ϕ ), ∂ϕ ∂θ ∂ ∂ Lˆ y = i η(− cos ϕ + ctg θ sin ϕ ), ∂θ ∂ϕ ∂ Lˆ z = − i η . ∂ϕ Из уравнения (2.2.1) следует, что величина вектора момента имρ ρ пульса L зависит от выбора начала отсчета r . В то же время проекции операторов моментов импульса Lˆ x , Lˆ y , Lˆ z на соответствующие координатные оси не зависят от выбора начала отсчета и поэтому направления координатных осей для них может быть выбрано произвольно. ρ Так как собственное значение оператора момента импульса Lˆ в принципе определить невозможно, это означает, что одновременное определение трех и даже двух значений проекций моментов импульса невозможно. Однако любое собственное значение хотя бы одной проекции оператора все-таки определить возможно. Расчет показывает, что оператор квадрата момента импульса
70
ρ ⎛ 1 ∂ ⎛ ∂ 1 ∂ 2 ⎞ ⎞⎟ ˆ ⎜⎜ sin θ + ⎟ . L 2 = − η2 ⎜⎜ ∂θ sin 2 θ ∂ϕ 2 ⎟⎠ ⎟⎠ ⎝ sin θ ∂θ ⎝
Тогда
ρ ˆ (2.2.7) L2 ψ = L2 ψ , L2 = η2 λ(λ + 1), где ℓ – так называемое орбитальное квантовое число, ℓ = 0, 1, 2, … . ρ Иными словами, несмотря на то, что направление вектора L в пространстве не определено, а потому ρ ˆ L ψ ≠ Lψ ,
ρ ˆ
собственное значение оператора L2 все-таки определить можно. Из всех операторов проекций момента импульса на координатные оси X, Y, Z наиболее простое выражение имеет оператор проекции на ρ ось 0Z. Определим собственное значение проекции Lz : ∂ψ (2.2.8) Lˆ z ψ = Lz ψ, − i η = Lz ψ. ∂ϕ Отсюда после разделения переменных и последующего интегрирования получаем: ψ = ψ0
i Lz ϕ eη
= ψ0 e
⎛L ⎞ i ⎜ z (ϕ − 2 π ) + 2 π m ⎟ ⎝ η ⎠
или Lz (ϕ − 2 π) + 2 π m = Lz ϕ . η η Тогда после сокращения на величину (Lzφ)/ћ получаем Lz (2.2.9) (ϕ − 2 π) + 2 π m = Lz ϕ. η η Отсюда Lz = ηm , где m – магнитное квантовое число, m = 0,±1,±2, …,±ℓ, ℓ – орбитальное квантовое число. Итак, в отсутствие внешних полей направление оси 0Z в пространстве никак не определено. Наличие внешнего магнитного поля позволяет однозначно определить направление оси 0Z в пространстве. В этом случае принято, что координатная ось 0Z направлена вдоль вектора внешнего магнитного поля. В качестве примера вычислим кинетическую энергию электрона, вращающегося вокруг ядра атома
71 2
Iω (2.2.10) , 2 где I – момент инерции электрона, ω – угловая скорость вращения. Угловую скорость выразим через момент импульса L (2.2.11) ω= . I Тогда после подстановки в (2.2.11) и (2.2.10) значения L из (2.2.7) получаем η2 (2.2.12) ε к вр = λ(λ + 1). 2I Из (2.2.12) следует, что кинетическая энергия вращательного движения электрона вокруг ядра атома – всегда дискретная величина, она не может принимать любые непрерывные значения. Опыт подтверждает этот результат. ε к вр =
2.3. Атом водорода
Точное аналитическое решение допускают лишь немногие задачи квантовой механики. К ним относится задача об атоме водорода. На примере атома водорода можно в общих чертах понять методы решения подобных задач для многоэлектронных атомов. В этом состоит большая познавательная ценность такого анализа. Атом водорода – простейший из атомов вещества, он состоит из ядра (протон) и вращающегося вокруг него электрона. Считаем, что центр инерции атома совпадает с центром инерции ядра. Это допущение достаточно обосновано, так как масса ядра значительно больше массы электрона. Движение электрона происходит вокруг силового центра в поле кулоновских сил. Поле таких сил обладает сферической симметрией. В квантовой механике понятие траектории отсутствует. С помощью волновой функции можно определить лишь вероятность положения электрона в атоме и тем самым составить представление о характере его движения. Электрическое поле протона, в котором находится электрон, определяет потенциальную энергию электрона e2 (2.3.1) U =− < 0. 4 π ε0 r
72
Запишем стационарное уравнение Шредингера в сферической системе координат: 2m (2.3.2) ∆ψ(r , θ, ϕ) + 2 e (ε − U ) ψ(r , θ, ϕ) = 0, η где ∆ – оператор Лапласа; ε – собственная энергия оператора Гамильтона (полная энергия электрона в атоме). Оператор Лапласа в сферической системе координат имеет вид: ∂ ∂ 1 ⎛∂ 1 ⎛ ∂ 1 ∂ 2 ⎞ ⎞⎟ ⎜⎜ sin θ + ⎟ . ∆ = 2 ⎜⎜ r 2 + ∂θ sin θ ∂ϕ 2 ⎟⎠ ⎟⎠ r ⎝ ∂r ∂r sin θ ⎝ ∂θ Отсюда следует, что его можно представить в виде двух слагаемых, одно из которых зависит только от координаты r, а другое – от углов θ и φ: 1 (2.3.3) ∆ = 2 (∆ r + ∆ θ,ϕ ), r где ∂ 1 ∂2 ⎞ ∂ ∂ 1 ⎛ ∂ ⎜⎜ sin θ + ⎟. ∆ r = r 2 , ∆ θ ,ϕ = ∂θ sin θ ∂ϕ2 ⎟⎠ ∂r ∂r sin θ ⎝ ∂θ Тогда уравнение (2.3.2) можно записать по-иному: 1 (2.3.4) (∆ r + ∆ θ,ϕ ) ψ(r, θ, ϕ) + 2m2 e (ε − U ) ψ(r, θ, ϕ) = 0. 2 r η Для решения уравнения (2.3.4) применим метод разделения переменных Фурье, согласно которому волновую функцию ψ(r,θ,φ) можно представить в виде произведения двух волновых функций, причем каждая из них зависит либо от координаты r, либо от углов θ и φ: (2.3.5) ψ ( r , θ, ϕ) = ψ ( r )ψ (θ, ϕ) . Заметим, что применение метода Фурье в нашем случае возможно потому, что потенциальная энергия электрона не зависит от времени. Подставим значение ψ(r,θ,φ) из (2.3.5) в уравнение (2.3.4): 2me ψ (θ, ϕ) ∆ r ψ (r ) + ψ (r )∆ θ, ϕ ψ (θ, ϕ) + 2 r 2 (ε − U )ψ (r )ψ (θ, ϕ) = 0 . η Каждое из слагаемых полученного уравнения разделим на волновую функцию (2.3.5): ∆ θ, ϕψ(θ, ϕ) ∆ r ψ ( r ) 2m e 2 + 2 r (ε − U ) + = 0. ψ(r ) ψ(θ, ϕ) η В полученном уравнении два первых слагаемых зависят только от координаты r, а одно слагаемое – только от углов θ и φ, следовательно, их можно разъединить, записав
73
∆ θ, ϕψ(θ, ϕ) ∆ r ψ ( r ) 2m e 2 (2.3.6) + 2 r (ε − U ) = − = λ. ψ (r ) ψ (θ, ϕ) η Уравнения (2.3.6) корректно, если каждое из них равно одной и той же постоянной величине λ, эта величина будет определена в дальнейшем. Таким образом, уравнение (2.3.6) представляет собой два взаимосвязанных дифференциальных уравнения с коэффициентом связи λ. Рассмотрим первоначально угловую часть уравнения Шредингера (2.3.7) ∆ θ ,ϕ ψ (θ, ϕ) + λψ (θ, ϕ) = 0 .
Как следует из (2.3.3), sin 2 θ ⋅ ∆ θ,ϕ = ∆ θ + ∆ ϕ .
Уравнение (2.3.7) умножим на sin2θ : sin 2 θ ∆ θ,ϕ ψ (θ, ϕ) + λ sin 2 θ ψ (θ, ϕ) = 0 . Но так как ψ (θ, ϕ) = ψ (θ) ψ (ϕ), то (∆ θ + ∆ ϕ ) ψ(θ) ψ (ϕ) + λ sin 2 θ ψ (θ) ψ (ϕ) = 0. Из полученного уравнения видно, что и в этом случае переменные разделяются: ∆ ψ (ϕ) ∆ θ ψ (θ) = m2 , + λ sin 2 θ = − ϕ ψ (ϕ) ψ (θ)
где m = const. В результате имеем ∆ θψ (θ) + λ sin 2 θ ψ (θ) = m 2 , ∆ ϕψ(ϕ) + m ψ(ϕ) = 0. 2
(2.3.8) (2.3.9)
Решением уравнения (2.3.9) является волновая функция ψ(φ)=ψ0eimφ, оно совпадает с решением дифференциального уравнения (2.2.8) в разделе 2.2. Поэтому постоянная m имеет ясный физический смысл – это магнитное квантовое число, следовательно, m = 0, ±1, ±2, ±3, …. Анализ показывает, что решение уравнения (2.3.8) возможно, если λ = λ(λ + 1), λ = 0,1, 2, 3, Κ . ℓ – орбитальное квантовое число. Теперь вернемся к координатной части уравнения Шредингера. Из (2.3.6) следует, что ⎞ ⎛ 2m ∆ r ψ ( r ) + ⎜ 2 e r 2 (ε − U ) − λ ⎟ ψ ( r ) = 0 ⎝ η ⎠ или в развернутом виде d 2 ψ (r ) 2 dψ (r ) λ(λ + 1) ⎞ ⎛ 2m + + r 2 ⎜ 2 e (ε − U ) − ⎟ ψ(r ) = 0 . (2.3.10) r dr dr 2 r2 ⎠ η ⎝
74
Решение уравнения (2.3.10) возможно, если полная энергия электрона квантована: me e 4 (2.3.11) ε=− 2 , ν = 0, 1, 2, 3, ... . 2 8 h ε 0 (ν + λ + 1) Обозначим n=ν+ℓ+1, n – главное квантовое число, n = 1,2,3,…,∞. Отсюда следует, что ℓ = 0, 1, 2, 3, … , n - 1; m = 0, ±1, ±2, ±3, … , ±ℓ . Тогда полная энергия электрона в атоме водорода m e4 1 (2.3.12) ε = − e2 ⋅ 2 , 8 h ε0 n Это энергия стационарного состояния, она всегда квантована. Теперь определим волновые функции ψ(r) и ψ(θ). Волновая функция ψ(φ) была ранее определена в (2.3.10). Как показывает анализ, при заданном магнитном квантовом числе m регулярное решение ψ(θ) имеет следующий вид: 1
⎛ ( 2 λ + 1)(λ − m )! ⎞ 2 m ⎟ sin θ Pλ m ( cos θ ), ψ (θ) = ⎜⎜ ⎟ ⎝ 2 (λ + m )! ⎠
(2.3.13)
где Pλ m ( cos θ ) – присоединенный полином Лежандра. Решение для радиальной части уравнения ψ(r) имеет вид: 1
λ
3 − − ⎛ 2ρ ⎞ ⎛ 4(n − λ − 1)! ⎞ 2 n ⎛ 2ρ ⎞ ⎟ ( a0 ) 2 ⎜ ⎟ e L2nλ++λ1 ⎜ ⎟ , ψ ( r ) = ⎜⎜ 4 3 ⎟ ⎝ n ⎠ ⎝ n ⎠ ⎝ n ((n + λ)!) ⎠ 2 где a 0 = η , ρ = r , L2nλ++11 ⎛⎜ 2ρ ⎞⎟ – полином Лагерра. a0 me e 2 ⎝ n ⎠ Общее число возможных решений при n = const равно n −1
∑ (2 λ + 1) = n λ= 0
2
.
ρ
(2.3.14)
(2.3.15)
Итак, получается, что заданному значению n соответствует n2 различных волновых функций. Другими словами говоря, полной энергии ε соответствует n2 различных волновых функций. В подобных случаях говорят, что данное состояние вырождено с кратностью вырождения n2. Вырождение снимается внешним возмущением со стороны электрического или магнитного поля.
75
2.4. Снятие вырождения состояний в атоме водорода
Ранее в разделе 2.3 было показано, что одному и тому же главному квантовому числу n соответствуют n2 различных состояний. Физически это означает, что в отсутствие действия внешних электрических и магнитных полей эти состояния оказываются совпадающими по энергиям, т.е. вырожденными и потому физически неразличимыми. Если же атом находится во внешнем электрическом или магнитном поле, то вырождение состояний у него снимается. Электрическое поле снимает вырождение состояний по орбитальному квантовому числу ℓ, магнитное поле – по магнитному квантовому числу m. Если же в объеме, где находится атом, одновременно существуют электрические и магнитные поля, то вырождение снимается как по орбитальным, так и по магнитным квантовым числам. Тогда каждой паре значений квантовых чисел ℓ и m будет соответствовать свое значение полной энергии, свой уровень полной энергии: уровень полной энергии расщепляется на столько уровней, сколько существует их возможных значений, т.е. на n2 уровней. Рассмотрим более детально физическую причину снятия вырождений состояний в атоме водорода. 2.4.1. Снятие вырождения состояний по магнитному квантовому числу Пусть атом водорода находится в магнитном поле, в частности, это поле может быть либо внешним, либо оно создается другими движущимися электронами, его величина должна быть достаточно большой, порядка 1 Тл, в противном случае эффект расщепления уровней полной энергии будет незаметен. Введем систему координат, у которой координатная ось 0Z в пространстве совпадает с направлением вектора индукции магнитного поля B (рис.2.4.1.1). Воспользуемся полуклассическим приближением о движении электрона. В данном случае оно приводит к правильному результату. На рис. 2.4.1.1 положение электрона q2 определяется радиусомρ ρ вектором r , v – мгновенная скорость электрона. Мысленно будем считать, что каждому мгновенному положению электрона соответствует своя траектория, вдоль которой электрон движется по круговой орбите. Мгновенное положение оси вращения такой круговой орбиты образует с осью 0Z угол α. Вращающийся вокруг ядра электрон облаρ ρ дает моментом импульса L и магнитным моментом pm . Движущийся
76
по воображаемой орбите электрон создает ток J, а вращающийся вокруг ядра (протона) электрон обладает моментом инерции I. ρ pm
z
ρ B
α
I q2 = e < 0
ρ r
ρ v
q1
ρ
ω
ρ L
Рис. 2.4.1.1. Движение электрона по орбите в магнитном поле По определению, магнитный момент кругового тока q (2.4.1.1) pm = J ⋅ S = 2 π r 2 . T Момент импульса вращающегося вокруг ядра электрона 2π (2.4.1.2) L = I ω = me r 2 , T где T – период обращения электрона вокруг ядра. Запишем отношение pm q (2.4.1.3) = 2 = g, L 2me g – гиромагнитное отношение. Из рис. 2.4.1.1 следует, что орбитальные магнитный момент и момент импульса направлены в противоположные стороны, поэтому ρ ρ (2.4.1.4) p m = − g L. Находясь во внешнем магнитном поле, круговой ток приобретает дополнительную энергию ρ ρ (2.4.1.5) ∆ε = − pm B = g B L cos α, причем L cos α = Lz = m η, m – магнитное квантовое число. Поэтому ∆ε = g B η m , (2.4.1.7) m = 0, ± 1, ± 2, ± 3, ... , ± λ.
77
Таким образом, каждый уровень полной энергии расщепляется на 2l+1 уровней (рис. 2.4.1.2).
n
ε
∞
0
3
2
} }
4∆ε
2∆ε
Рис. 2.4.1.2. Расщепление энергетических уровней электрона в магнитном поле Заметим, что при такой постановке задачи на воображаемый круговой ток действует момент силы, под влиянием которого плоскость орρ биты вращается с угловой скоростью прецессии Ω . Причина вращения воображаемого кругового тока в следующем. По определению, момент силы, действующий на круговой ток, ρ ρ ρ M = pm × B , под действием этого момента силы мгновенная плоскость воображаемой орбиты вращается вокруг оси 0Z с угловой скоростью прецессии ρ ρ Ω = g B. Такой способ описания движения электрона по сложной незамкнутой криволинейной траектории позволяет значительно упростить анализ движения: реальное движение можно разложить на два простых движения, которые легко подаются анализу и расчету. В основном состоянии радиус первой орбиты электрона r = 0,53·10-10 м, период обращения по орбите Т = 1,52·10-16 с. Кроме того, q2 = 1,6·10-19 Кл, me = 9,1·10-31 кг, g = 1,76·1011 Кл/кг. Тогда при индукции внешнего магнитного поля В = 10 Тл имеем pm = 1,75·10-13 А·м; М = 1,75·10-12 Н·м; Ω = 1,76·1012 с-1 ; ∆ε=0,004 эВ.
78
Из рассмотренного примера следует, что вырождение состояний по магнитному квантовому числу снимается только в сильных магнитных полях. Внешними макроскопическими источниками такие поля создавать достаточно сложно. Другое дело – поле в многоэлектронных атомах. В них в центральной части атома магнитное поле создается всеми электронами электронной оболочки атома. Эти поля достаточно велики. Так, если воспользоваться результатами рассмотренного выше примера, то окажется, что индукция магнитного поля, созданного электроном атома водорода в состоянии с главным квантовым числом n = 2 в центре атома, В = 3,67·109 Тл . Сравним теперь угловую скорость орбитального движения электрона с угловой скоростью прецессии. Вычисление отношения этих угловых скоростей дает величину 23000, т.е. мгновенная угловая скорость вращения электрона на воображаемой круговой орбите будет в десятки тысяч раз больше величины угловой скорости прецессии орбиты. Поэтому при проведении расчетов плоскость орбиты электрона можно считать практически неподвижной. 2.4.2. Снятие вырождений по орбитальному квантовому числу Рассмотрим теперь, как снимается вырождение состояний по орбитальному квантовому числу. Пусть атом находится во внешнем электрическом поле. Под действием этого поля электронная оболочка атома смещается, происходит поляризация атома: в пространстве вместо нейтрального атома возникает эффективный диполь, образованный смещенным эффективным отрицательным зарядом электронной оболочки атома q2* и положительно заряженным ядром (протоном) q1 (рис. 2.4.2.1). Конечно, эта наглядная модель является приближенной, но она весьма удобна для дальнейших вычислений. Строго говоря, подобная задача может быть решена только методами квантовой механики, и то лишь для водородоподобных атомов. Для более сложных атомов решение возможно приближенными методами. Качественный подход дает следующий результат. Пусть атом водорода находится во внешнем электрическом поле, тогда под действием сил электрического поля в пространстве произойдет смещение более легкого электрического заряда q2 = e относительно тяжелого заряда протона на величину эффективного плеча ди-
ρ
поля λ . В результате в объеме возникает эффективный диполь, электрический момент которого ρ ρ pe = q *2 λ.
79
ρ F1
q1 q*2
ρ E
ρ λ
ρ r
q2
ρ* F2
Рис. 2.4.2.1. Смещение орбиты электрона в электрическом поле Для состояний с главными квантовыми числами n > 1 pe=const>0. Возникновение эффективного диполя приводит к тому, что атом в электрическом поле приобретает дополнительную энергию ρ ρ ∆ε = − pe E . С точки зрения квантовой механики причина здесь следующая. В отсутствие внешнего электрического поля полная энергия атома зависит только от величины момента импульса L и не зависит от его ориентации в пространстве. Во внешнем электрическом поле ориентации моментов импульса на ось 0Z квантованы: Lz = m η . Атом приобретает дополнительную энергию, которая при этом может принимать только дискретные значения. Анализ показывает, что каждый уровень полной энергии расщепляется на несколько уровней, энергетический интервал между которыми (2.4.2.1) ∆ε = A ⋅ ( 2 λ − ( n − 1) + m ) n E , -9 Здесь A – нормирующий множитель, A = 1, 6·10 эВ·м/В; n, ℓ, m – главное, орбитальное, магнитное квантовые числа. Расщепление уровней энергии под действием электрического поля называется эффектом Штарка. В табл. 2.1 приводятся значения интервалов ∆ε между соседними уровнями полной энергии, вычисленные по формуле (2.4.2.1) при различных значениях квантовых чисел n, ℓ, m в электрическом поле Е = 107 В/м.
80
n 1
m
ℓ 0 0 1 1
2
0 0 0 1
∆ε 0 -2A·E 2A·E 4A·E
∆ε, эВ 0 -0,016 0,016 0,032
Таблица 2.1. Значения интервалов между соседними уровнями полной энергии n
∞
ε
E1
E2
1
m
1 1
1 0
0
0
0
0
0
∆ε 2
λ
2∆ε
Рис. 2.4.2.2. Расщепление энергетических уровней электрона в электрическом поле Как следует из табл. 2.1, заметное расщепление уровней полных энергий можно наблюдать лишь в сильных электрических полях. Опыт подтверждает установленный теоретически результат. Линейный эффект Штарка характерен для атомов водорода в не слишком сильных полях и составляет тысячные доли эВ при напряженности электрического поля Е = 106 В/м. На рис. 2.4.2.2 изображены уровни полных энергий электрона в атоме водорода как в отсутствие внешнего электрического поля Е1, так в электрическом поле напряженностью Е2 для различных квантовых чисел. Уровень полной энергии, соответствующий невозбужденному состоянию атома, в электрическом поле пропадает, а вновь возникшие уровни полной энергии теперь расположены несимметрично. Штарк-эффект наблюдается не только у атомов водорода, но и у многоэлектронных атомов, например, у атомов щелочных металлов.
81
2.5. Спектральные серии атома водорода
Мы теперь знаем выражение для полной энергии электрона в атоме водорода: m e4 1 (2.5.1) ε = − e2 2 ⋅ 2 . 8h ε 0 n Из уравнения (2.5.1) следует, что полная энергия электрона в атоме всегда отрицательная. Наименьшее значение полной энергии соответствует главному квантовому числу n = 1. Этому квантовому числу соответствует основное, невозбужденное состояние. Все состояния с иными значениями квантовых чисел n > 1 являются возбужденными. В отсутствие внешних электрических и магнитных полей эти состояния являются вырожденными, поэтому различным значениям квантовых чисел ℓ и m при фиксированном значении n = const соответствуют одни и те же значения полной энергии ε. Для атома водорода не существует запрещенных переходов электрона с одного уровня полной энергии на другой, поскольку каждому значению n соответствуют n2 различных состояний с одинаковым значением полной энергии. Заметим, что представление о вырождении уровней энергии атомов водорода, строго говоря, является лишь приближенным. На самом деле уровни энергии с одним n и различными ℓ за счет релятивистских эффектов и эффектов квантового поля слегка отличаются друг от друга. Но эти тонкие эффекты настолько малы, что ими в большинстве случаев можно пренебречь. Отдельные состояния электрона в атоме изображают графически с помощью системы уровней полной энергии. Переход с верхнего уровня полной энергии на нижний сопровождается "высвечиванием", выделением избыточной порции энергии. А так как процесс "высвечивания" сопровождается непрерывным движением вокруг ядра электрического заряда, генерирующего электромагнитные волны, то высвобождающаяся энергия есть электромагнитная энергия, величина которой (2.5.2) ∆ε = h ν . где h – постоянная Планка, ν – частота колебаний напряженности электрического поля в электромагнитной волне. Величина избыточной "высвечивающейся" энергии называется квантом электромагнитного излучения. Переход электрона с нижнего уровня полной энергии на верхний возможен только в результате поглощения электроном кванта элек-
82
тромагнитной энергии, соответствующего разности энергии у этих двух состояний. Таким образом, излучение и поглощение – это взаимно обратные процессы. На рис. 2.5.1 изображены уровни полной энергии при различных значениях квантовых чисел. n
ε
∞
0
6 5 4 3 2 1
Рис. 2.5.1. Уровни энергии атома водорода Найдем разность энергии при переходе электрона с более высокого на более низкий уровень полной энергии электрона: (2.5.3) ∆ε = ε 2 − ε1 ; после подстановки в (2.5.3) значений из (2.5.1) и (2.5.2) получаем m e4 ⎛ 1 1 ⎞ hc (2.5.4) ∆ε = e2 2 ⎜⎜ 2 − 2 ⎟⎟ = . 8 h ε 0 ⎝ n1 n2 ⎠ λ 1 Обозначим ~ ν = – спектроскопическое волновое число, тогда из λ (2.5.4) имеем: m e4 ⎛ 1 1 ⎞ ~ (2.5.5) ν = 3e 2 ⎜⎜ 2 − 2 ⎟⎟ . 8 h c ε0 ⎝ n 1 n 2 ⎠ Обозначим
83 4
me e . (2.5.6) 8h 3cε 02 Величина R называется постоянной Ридберга. После этого уравнение (2.5.4) принимает достаточно простой вид: ⎛ 1 1 ⎞ ~ (2.5.7) ν = R ⎜ 2 − 2 ⎟. ⎜ n1 n 2 ⎟ ⎝ ⎠ Формула (2.5.7) называется сериальной формулой атома водорода, так как каждому значению n1 = const и различным значениям n2≥n1+1 соответствует своя спектральная серия. Перечислим возможные спектральные серии атома водорода: серия Лаймана – n1 = 1, n2 ≥ 2 – ультрафиолетовая область, серия Бальмера – n1 = 2, n2 ≥ 3 – видимая область, серия Пашена – n1 = 3, n2 ≥ 4 – инфракрасная область, серия Брэккета – n1 = 4, n2 ≥ 5 – инфракрасная область, серия Пфунда – n1 = 5, n2 ≥ 6 – инфракрасная область. Первая спектральная серия в спектре атома водорода была обнаружена в 1885 г. швейцарским физиком Бальмером задолго до создания квантовой механики. С этого началось систематическое исследование спектральных серий. Минимальная длина волны для серии Лаймана получается при n2 = 2. Она равна 4/3 R и называется резонансной линией атома водорода. При приближении к границе серии спектральные линии сгущаются. За границей серии спектр не обрывается, а становится сплошным. Это связано с тем, что электрон отрывается от атома, он становится свободным, поэтому его энергия не квантуется. Атом превращается в ион. R=
2.6. Спектральные серии атомов щелочных металлов
В атомах щелочных металлов внешняя электронная оболочка содержит один валентный электрон, слабо связанный с ядром атома. Остальные Z-1 электронов вместе с ядром образуют остов атома, в электрическом поле которого движется валентный электрон. Заряд ядра Ze > 0 и заряд (Z-1)e < 0 электронной оболочки мысленно можно заменить одним эффективным зарядом q*=e>0. А так как распределение электронов в остове атома не обладает сферической симметрией, то положение эффективного заряда q* в пространстве не совпадает с положением ядра. Поэтому валентный электрон будет двигаться в результирующем электрическом поле, не обладающем сферической
84
симметрией. Следовательно, силу, действующую на валентный электрон, нельзя определить из закона Кулона: закон Кулона выполняется только в случае сферически симметричных полей. Таким образом, в пространстве возникает эффективный электрический диполь, образованный эффективным зарядом остова атома и валентным электроном (рис.2.6.1).
ρ v
Ze> 0
e<0 me
q = ( z −1) e < 0 Рис. 2.6.1. Схема возникновения эффективного диполя в атоме водорода Теперь потенциальная энергия валентного электрона отличается от потенциальной энергии электрона водородоподобного атома – атома, у которого в электронной оболочке только один электрон, а заряд ядра Ze. В результате потенциальную энергию взаимодействия валентного электрона с остовом атома можно записать в виде разложения в ряд, причем первым слагаемым будет энергия равная потенциальной энергии электрона в атоме водорода: e q * ⎛ U 01 U 02 ⎞ U =− + 2 + ...⎟ , ⎜1 + r r 4 π ε0 r ⎝ ⎠ где q* – эффективный заряд остова атома, q* = e > 0, U01 , U02 – коэффициенты разложения потенциальной энергии в степенной ряд. Стационарное состояние валентного электрона в электрическом поле остова атома по-прежнему характеризуется квантовыми числами n, ℓ, m, причем вырождение по квантовому числу ℓ теперь снимается. Это происходит потому, что потенциальная энергия валентного электрона отличается от кулоновской. Что же касается магнитного квантового числа m, то в отсутствие внешнего магнитного поля различные состояния по квантовому числу m являются вырожденными, т.е. различным значениям m и при одних и тех же значениях квантовых чисел n и ℓ соответствует одна и та же полная энергия.
85
Различные состояния электрона в атоме принято обозначать маленькими буквами латинского алфавита, причем каждой букве соответствует состояние с определенным значением орбитального квантового числа ℓ. Эти состояния приведены в табл. 2.2. ℓ Обозначение состояния
0
1
2
3
4
5
s
p
d
f
g
h
Таблица 2.2. Состояния электрона в атоме Так как при таком подходе в строении атомов щелочных металлов и атома водорода много общего, то и формула полной энергии валентного электрон должна быть подобна формуле полной энергии электрона в атоме водорода. Разница должна состоять в наличии поправки у главного квантового числа: m e4 1 (2.6.1) ε = − e2 2 ⋅ , 8 h ε 0 ( n − ∆n ) 2 где ∆n – квантовый дефект, 2 2 me e 2 ⎞⎟ 1 ⎛⎜ ⎛ 1 ⎞ (2.6.2) ∆n = − ± ⎜ l + ⎟ − c1 −l , η2 ⎟⎠ 2 ⎜⎝ ⎝ 2 ⎠ c1 –- постоянный множитель; n > ∆n > 0. Из (2) следует, что ∆n = ∆n(ℓ), поэтому теперь полная энергия валентного электрона зависит от квантовых чисел n и ℓ. Иными словами, в электрическом поле остова атома вырождение по квантовому числу ℓ снимается, а по m по-прежнему сохраняется. Объясняется это тем, что в изотропном пространстве полная энергия не зависит от m. Теперь введем понятие спектрального терма Т, определив его как ε T =− . hc Тогда с учетом (1) получим 1 m e4 R (2.6.3) T = 3e 2 ⋅ , = 2 8 h ε 0 c ( n − ∆n ) ( n − ∆n ) 2 где R – постоянная Ридберга. Спектральный терм Т – это краткая запись полной энергии валентного электрона в атоме. Так как квантовый дефект ∆n зависит от орбитального квантового числа ℓ, то для краткости записи вводится следующее условное обозначение терма: T = n ℓ . Так, например, терму 3s соответствуют квантовые числа n=3, ℓ=0 .
86
R R R , , . np = nd = 2 2 (n − ∆n( s) ) (n − ∆n( p) ) (n − ∆n(d ) )2 Физический смысл принятых обозначений будет ясен из следующих примеров. Если использовать понятие терма, то переходы валентного электрона из одного квантового состояния в другое, сопровождающиеся излучением кванта энергии электромагнитных волн, можно весьма просто выразить через разность термов: hc (2.6.4) ∆ε = = h c (T1 − T2 ) , λ 1 где ~ ν = – спектроскопическое волновое число. λ Тогда ~ (2.6.5) ν = n1l1 − n2l2 , R (2.6.6) . T= (n − ∆n(l )) 2 Из курса "Электричество и магнетизм" следует, что мгновенный диполь, у которого заряды все время перемещаются в пространстве с ускорением, излучает электромагнитные волны. Если положение движущегося отрицательного заряда диполя отсчитывать от центра инерции эффективного заряда остова атома, то эффективный электрический момент диполя ρ ρ (2.6.7) p = q ⋅ r (t ) , где q – заряд валентного электрона, находящегося за пределами остова ρ атома, r (t ) – мгновенный радиус-вектор валентного электрона относительно центра инерции эффективного заряда остова атома (рис. ns =
ρ ρ
ρ
2.6.2). На рис. 2.6.2 r (t ) = - λ , λ – плечо диполя, q* – эффективный заряд остова атома, q* = e > 0. ρ λ q<0
q* > 0
Рис. 2.6.2. Общая схема возникновения эффективного диполя в атоме Итак, валентный электрон вращается вокруг остова атома. Значит, в пространстве всегда существует эффективный электрический диρ ρ поль pe = q λ .
87
Первоначально предположим, что, в полуклассическом приближении, эффективные заряды валентного электрона и остова атома совпадают. Тогда атом будет электрически нейтрален. Электрический момент диполя отсутствует. В действительности валентный электрон движется по сложной криволинейной траектории. В результате положение электрического заряда валентного электрона не совпадает с положением эффективного заряда остова атома, возникает мгновенный электрический диполь. Так как валентный электрон все время находится в движении, его положение в пространстве непрерывно меняется, то вектор электрического момента диполя относительно центра инерции остова атома также непрерывно меняет не только направление в пространстве, но и величину электрического момента. Это эквивалентно переходу электрона из одного состояния, например, состояния i, в другое, например, состояние k. Но можно сказать и обратное: переход валентного электрона из состояния i в состояние k приводит к изменению электрического момента диполя. В общем случае изменение состояния валентного электрона сопровождается излучением. Среднее значение электрического момента диполя, по определению, будет ρ ρ (2.6.8) pe i k = ∫ ψ *k pe ψ i dv , где ψi , ψk* – волновые функции валентного электрона в начальном ψi и конечном ψk состояниях. ρ Если среднее значение peik ≠ 0 , то в результате такого перехода
ρ
возникает дипольное излучение атома, если же peik ≠ 0 , то дипольное излучение отсутствует. Переходы называются разрешенными, есρ ли peik ≠ 0 , а те ограничения, которые накладываются при этом на величину изменения квантовых чисел, называются правилами отбора. В случае дипольного излучения существуют следующие правила отбора: ∆ℓ= ±1, ∆m= 0,±1. Что же касается возможных значений главных квантовых чисел n, то на их изменения никаких ограничений не накладывается. Однако с увеличением разности n2 - n1 вероятность перехода валентного электрона из одного состояния в другое постепенно уменьшается. В результате у атомов щелочных металлов с учетом правил отбора могут возникать следующие спектральные серии: главная серия диффузнная серия резкая серия фундамента льная серия
ν~гл = ns − n1 p , ν~д = np − n2 d , ν~р = np − n2 s , ν~ф = nd − n2 f ,
88
причем n1 = n, n + 1, n + 2, . . . ; n2 = n1 + 1. Слева приведены исторически возникшие названия серий. n ε
нм
4d
78 ,2
4p
5f 12
нм
м 2,
7
,7 69 18
3d нм
3p нм
2p 0 67
н ,8
61 0,4
81
413 ,
2н 253 ,
6н
м
3s
4f
м
,3 н
4s
2s
5d
427
5s
5p
м
Рис. 2.6.4. Возникновение спектральных серий в излучении атома лития На рис. 2.6.3 изображена схема уровней полных энергий атома Li и возможные переходы валентного электрона, сопровождающиеся излучением электромагнитных волн. На этой схеме легко выделить все указанные выше спектральные серии. В заключение хочется еще раз подчеркнуть, что сформулированные выше правила отбора относятся только к дипольному излучению. Однако в природе могут возникать и другие виды излучений, например, квадрупольное. Они менее вероятны, и мы их здесь не рассматриваем. Для них существуют иные правила отбора. Изучение спектров излучения атомов щелочных металлов показало, что линии основных серий этих атомов являются двойными, дублетными. Например, желтая линия Na, обусловленная переходом 3p– 3s, состоит из двух линий: λ1 = 589,0 нм и λ2 = 589,6 нм. Структуру спектра, в которой происходит расщепление спектральных линий, называют тонкой структурой. Спектральную линию, состоящую из несколько близко расположенных компонент, называют мультиплетом. Одиночные линии называют синглетами, двойные –
89
дублетами и т.д. Аналогичная терминология используется и для характеристики самих уровней энергии (термов). Расщепление спектральных линий в атомах щелочных металлов означает, что расщепляются уровни полной энергии валентного электрона, между которыми происходят радиационные переходы. Анализ их спектров указал на то, что у них s-состояния (ℓ=0) синглетны, а p-, d-, f- состояния (ℓ = 1, 2, 3) дублетны. С помощью квантовых чисел n, ℓ , m причину расщепления уровней объяснить не удается. Это можно объяснить, если ввести новое квантовое число. Но об этом – в следующем параграфе. 2.7. Физическая причина возникновения тонкой структуры в спектре атомов щелочных и щелочноземельных элементов
Для анализа спектров излучения и поглощения многоэлектронных атомов обычно используется векторная модель атома. Но на ее основе можно получить только качественные или полуколичественные результаты. В связи с этим объяснение наблюдаемых явлений носит специфический характер. Частично оно состоит из перечисления правил, которые не поддаются наглядной интерпретации, хотя некоторые из этих правил можно пояснить с помощью наглядной модели. А вообще-то лишь очень немногие из утверждений доказываются достаточно строго. Теперь мы знаем, что даже решение задачи об атоме водорода требует знания специальных функций, большой математической эрудиции и достаточно трудоемко. А ведь атом водорода – это простейший из возможных атомов. Нетрудно представить, какой математический аппарат необходим, чтобы решить задачу для реальных случаев, при условии, что точное решение задачи вообще возможно. Из многоэлектронных атомов здесь мы рассмотрим атомы щелочных и щелочноземельных элементов. Опыт показывает, что каждый уровень полной энергии валентного электрона у этих атомов состоит из двух или трех близко расположенных уровней. Следовательно, существует какая-то причина, вызывающая такое расщепление уровней. Известно, что электрический заряд электронной оболочки атомов щелочных и щелочноземельных элементов практически полностью компенсируется положительным зарядом ядра. Поэтому остов атома обладает эффективным положительным зарядом, заряд у атомов щелочных элементов равен (Z - 1)e, у атомов щелочноземельных элементов равен (Z - 2)e. Остальные один или два валентных электрона, сравнительно слабо связанные с остовом, вращаются вокруг остова,
90
находясь при этом в эффективном электрическом поле остова атома. Состояние электрона в атоме определяется квантовыми числами n, ℓ, m. Однако при фиксированном значении главного квантового числа n состояние атома будет определяться значением орбитального квантового числа ℓ. Но поскольку теперь это состояние характеризует состояние всего атома, то для определения состояния атома вводят большие латинские буквы: L = S, P, D, F, G, H. Эти буквы имеют тот же смысл, что и буквы ℓ = s, p, d, f, h. Тогда при фиксированном значении главного квантового числа n каждым значениям ℓ , m будет соответствовать определенная энергия. Следовательно, каждый атом будет иметь различный дискретный набор полных энергий, как это изображено на рис. 2.7.1, где ∆Nℓ – кратность вырождения, или число уровней полной энергии, соответствующих состоянию атома с заданным значением квантового числа L . l = 0 , m = 0 ; ∆Nl = 1
S
l = 1, m = 0, ±1; ∆N l = 3 = 2l +1
P
l = 2 , m = 0, ±1, ± 2 ; ∆Nl = 5 = 2l +1
D
Рис. 2.7.1. Дискретный набор уровней энергии для разных L Более тщательные спектроскопические измерения показали, что уровни полной энергии состоят из двух или трех близко расположенных уровней. Это указывает на то, что использованный набор квантовых чисел является недостаточным для понимания физической причины расщепления. Для объяснения расщепления уровней полных энергий в 1925 году голландские ученые Уленбек и Гаудсмит высказали гипотезу, что это вызвано наличием у электрона собственного ρ момента импульса Ls . В то время по аналогии с ядром атома электрон представлялся в виде жесткого заряженного шарика, вращающегося вокруг оси симρ метрии с угловой скоростью ω (рис. 2.7.2). Поэтому собственный момент импульса электрона ρ ρ (2.7.1) Ls = Iω . На основе этой гипотезы им удалось объяснить физическую причину наблюдаемого на опыте расщепления уровней полной энергии электрона в атомах щелочных металлов. Свои расчеты, с использованием представлений о собственном моменте импульса электрона, они
91
решили опубликовать. Подготовили научную статью и направили ее в журнал "Nature" ("Природа"), редактором которого был выдающийся физик того времени Зоммерфельд. Однако авторов статьи все время терзали сомнения в правильности исходных предположений. Дело в том, что представление об электроне как о заряженном шарике вызывает серьезное возражение.
ρ
ω
ρ L s
Рис. 2.7.2. Модель возникновения собственного момента импульса электрона по Уленбеку и Гаудсмиту Используя вычисленное значение момента импульса электрона, они пришли к выводу, что материя на поверхности такого шарика должна перемещаться вокруг центра шарика со скоростью больше скорости света в вакууме, что в принципе невозможно. Несколько поразмыслив, они решили обратиться к редактору журнала с просьбой вернуть статью обратно. Зоммерфельд принял авторов статьи и сказал им примерно следующее. – Журнал уже отдан в типографский набор и практически набран. Разбивать набор – это большая работа и приведет к задержке издания номера журнала. А, кроме того, Вы еще молоды, у Вас пока нет никакого научного авторитета, так что в случае опубликования статьи Вы ничем не рискуете, ничего не теряете. Гаудсмит и Уленбек согласились с доводами редактора. Статья была опубликована и стала достоянием научной общественности. В переводе на русский язык слово spin означает вращение. Этим словом они обозначили как процесс вращения электрона, так и собственный момент импульса, с ним связанный. Выше была указана причина, по которой модель электрона в виде шарика не вполне соответствует современным представлениям. В рамках классических представлений можно попытаться так отварьировать форму электрона, чтобы результат был менее противоречив, придав, например, электрону форму диска толщиной значительно меньше его радиуса (рис. 2.7.3).
92
ρ
R
ω
ρ
ω
Рис. 2.7.3. Дисковая модель возникновения собственного момента импульса электрона Тогда по аналогии с орбитальным движением электрона можем записать ρ ˆ (2.7.2) L2s ψ s = L2s ψ s , где L2s – собственное значение квадрата оператора момента импульρ са, ψs – собственная волновая функция оператора Lˆ2 : (2.7.3) L2s = η2 s (s + 1) . Каждый уровень полной энергии у атомов щелочных металлов является двойным. Это можно объяснить тем, что у атомов щелочных металлов вырождение состояний по спиновому квантовому числу снимается. Причина снятия вырождения вызвана тем, что валентный электрон теперь находится в электрическом поле остова, строго говоря, не обладающем сферической симметрией, а следовательно, не являющемся кулоновским. Поэтому (2.7.4) ∆N s = 2 = 2 s + 1 . Из (2.7.4) находим s = 1/2. Спиновое магнитное квантовое число ms=±s = ±1/2, оно определяет величину собственного магнитного момента электрона. Из опыта известно, что спиновое гиромагнитное отношение gs=2gℓ. Эту величину легко получить, пользуясь моделью электрона в виде диска*). Собственный магнитный момент электрона *)
Получившееся согласие с опытом ничего не говорит о реальной форме электрона. Классические представления здесь неприменимы. В настоящий момент нет ясности не только в форме, но и в размерах электрона. Бесспорно только одно: электрон обладает собственным моментом импульса – спином, величина которого хорошо известна.
93
e (2.7.5) π R2 , Ts где Ts – период вращения электрона вокруг оси симметрии, R – радиус электрона. Собственный момент импульса электрона m R2 2 π (2.7.6) Ls = e ⋅ . Ts 2 По определению, гиромагнитное отношение электрона при вращении его вокруг оси симметрии pm s . gs = Ls После подстановки значений pms и Ls из (2.7.5) и (2.7.6) имеем e (2.7.7) gs = = 2ge , me что совпадает с результатами опыта. Из опыта следует, что суммарный вектор собственных моментов импульса всех электронов остова атома полностью заполненной электронной оболочки всегда равен нулю. Так как электронная оболочка остова является замкнутой, то состояние атома определяется состоянием валентных электронов. Полный момент импульса атома можно получить двумя способами: ρ ρ ρ ρ ρ (2.7.8) L j = ∑ Ll i + ∑ Ls i = Ll + Ls , pm s =
i
i
ρ ρ ρ L j = ∑ Ll i + Ls i ,
(
)
(2.7.9)
i
причем (2.7.8) соответствует нормальной связи, а (2.7.9) – сильной связи между частицами. Состояние атома условно обозначают 2s+1TJ , Т – условное обозначение терма атома, S = s , S – полное спиновое квантовое число
∑ i
валентных электронов в атоме. Известно, что квадрат векторов проекций соответствующих моментов импульсов на ось 0Z ρ Ll2z = (ml η) 2 , ml = 0 , ± 1, ± 2 , ± 3 , ... , ± l ;⎫ ⎪ ρ 1 ⎪ (2.7.10) L2s z = (ms η) 2 , ms = ± s = ± ; ⎬ 2 ⎪ ρ2 L j z = (m j η) 2 , m j = ml + ms ; j = l ± s ⎪ ⎭ где
94
m j = − j , − ( j − 1), ... , ( j − l ), ... , j.
Полные орбитальные и спиновые момента импульса атома будут ρ ρ ρ ρ L = ∑ Ll i , S = ∑ Ls i . i
i
Тогда полный момент импульса всех электронов электронной оболочки атома ρ ρ ρ J = L+S , причем ρ ρ ρ J 2 = η2 J ( J + 1) , L2 = η2 L ( L + 1) , S 2 = η2 S ( S + 1) , J – внутреннее квантовое число. Квантовые числа J, L, S имеют смысл наибольших значений, которые могут принимать проекции ρ ρ ρ векторов J z , Lz , S z на направление OZ (см. (2.7.10)). Тогда (2.7.11) J = L + S , L + S − 1 , ..... | L − S | . Моменты импульсов электронной оболочки остова полностью ρ ρ ρ скомпенсированы, поэтому J z , Lz , S z соответственно равны векторам проекций валентных электронов на ось OZ: ρ ρ ρ ρ ρ ρ Lz = Ll z , S z = Ls z , J z = L j z . Итак, для определения состояния атома необходимо вычислить J, ρ ρ L, S. По физическому смыслу вектора Lz , S z расположены параллельно, поэтому их следует складывать алгебраически с учетом направлеρ ρ ρ ний отдельных векторов моментов импульсов: J z = Lz + S z . Так как теперь L = ℓ, S = s, J = j, то J=L±S. Если L = const, то, как следует из (2.7.11), число возможных состояний (2.7.12) ∆N j = 2 S + 1 . Рассмотрим более подробно физическую причину возникновения тонкой структуры спектральных линий сначала у атомов щелочных элементов, а затем у атомов щелочноземельных элементов. У атома щелочного металла имеется всего один валентный электрон, поэтому S = s = 1/2. Пусть первоначально L = 0, это означает, что среднее значение орбитального момента импульса равно нулю, а собственный момент импульса валентного электрона атома направлен либо в прямом, либо в обратном направлениях. С энергетической точки зрения
95
эти направления совершенно равнозначны, значит, им должна соотρ ρ ветствовать одна и та же полная энергия атома, Lsz ↑ или ↓ Lsz . Полное внутреннее квантовое число J = L + S = 1/2. Терм такого состояния будет 2S+1 TJ = 2S1/2. Пусть L = 1, S = 1/2. Здесь возможны два физически различных направления проекций на ось OZ орбитального и собственного моменρ ρ тов импульсов Lz и S z , что соответствует двум значениям внутренних квантовых чисел J: ρ ρ ρ S z2 = (η S ) 2 , L2z = (η L) 2 , J z2 = (η J ) 2 , J = L ± S .
ρ J z
ρ Sz ρ Lz
1 3 = 2 2
J =1+
Терм атома
ρ Sz ρ Lz
ρ J =1− 1 = 1 Jz 2 2
ТJ = 2P1/2 , 2P3/2 а кратность вырождения ∆NJ = 2 · 1/2 + 1 = 2. Пусть теперь L = 2, S = 1/2, L = 4·S. Изобразим направления проекρ ρ ций векторов Lz и S z : ρ Sz ρ Lz
2S+1
ρ J z J = 2 +
1 5 = 2 2
ρ Sz ρ Lz
ρ J z
J = 2 −
1 3 = 2 2
Термы атома этих состояния будет 2S+1 TJ = 2D3/2 , 2D5/2. Число возможных состояний и их обозначения приведены в следующей таблице. L J Уровень
0 ½ 2 S1/2
1 1/2, 3/2 2 P1/2, 2P3/2
2 3/2, 5/2 2 D3/2, 2D5/2
Если атом имеет два валентных электрона, то здесь могут встретиться два случая.
96
1. Проекции собственных моментов импульсов электронов антипараллельны, S=0. Число возможных состояний при любом L, согласно (2.7.11), равно 1. 2. Проекции собственных моментов импульсов электронов параллельны, S=1. ρ ρ ρ В случае нормальной связи J z = Lz + S z . Значит, при заданном наρ правлении вектора Lz в пространстве могут возникать три возможных значений полных квантовых чисел S, L, J,ρпричем S = 0,1 : ρ J Z = 0 , J = 0;
L=0
Sz ρ Sz
ρ JZ
ρ JZ ;
J = 1 + 1 = 2;
J =1
2S +1 T = 3S , 3 S 0 1 J L=1
ρ Sz ρ Lz
ρ Sz ρ Lz
ρ J Z = 0; S = 1, L = 1; J = 0;
2S +1 T = 3P , 3 P , 3P 0 1 2 J L=2 ρ Sz
ρ Lz
ρ ρ J Z = LZ J = 0 + 2 = 2;
ρ Sz ρ Lz
SZ = 0
ρ ρ LZ = J Z J = 1 + 0 = 1;
ρ Sz
ρ JZ ;
ρ Lz
ρ JZ;
J = 2 +1 = 3
J = 2 − 1 = 1;
2S +1 T = 3D , 3 D , 3D J 1 2 3
Возможные состояния атома приводятся в следующей таблице. L J Уровни
0 0, 1 3 S0, 3S1
1 0, 1, 2 3 P0, 3P1, 3P2
2 1, 2, 3 3 D1, 3D2, 3D3
2.8. Энергия спин-орбитального взаимодействия
Собственный магнитный момент валентного электрона в процессе движения все время находится в магнитном поле, созданном им же самим в результате орбитального движения. Поэтому электрон, а стало быть, и атом должны обладать дополнительной энергией, она называется энергией спин-орбитального взаимодействия: ρ ρ (2.8.1) ∆ε = − pm s Bl ,
97
ρ ρ где pms – вектор собственного магнитного момента электрона, Bλ – вектор индукции магнитного поля в месте локализации электрона, т.е. магнитного поля, возникающего в результате орбитального движения валентного электрона вокруг остова: ρ ρ ρ µ 0 pm l ρ µ0 ρ ⋅ 3 = − gl Ll . pm s = − g s Ls Bl = 2π r 2 π r3 Тогда величину энергии спин-орбитального взаимодействия можно оценить по формуле (1): µ0 ρ ρ (2.8.2) ∆ε = − g s g l Ls Ll . 2 π r3 Квадрат суммарного момента импульсов ρ ρ ρ ρ ρ L2j = L j L j = L2j = L2l + 2 Ll Ls + L2s .
Следовательно, скалярное произведение двух моментов импульса L2j = η2 j ( j + 1) , L2l = η2l (l + 1) , L2s = η2 s ( s + 1) . где ρ ρ 1 Ls Ll = − (L2j − L2l − L2s ) , 2 или ρ ρ η2 Ls Ll = − ( j ( j + 1) − l (l + 1) − s( s + 1) ) . 2 ρρ Подставим произведение Ls Lλ в (2.8.22) с учетом того, что g s = 2gℓ: µ 0 η2 (2.8.3) ( j ( j + 1) − l (l + 1) − s( s + 1) ) 2 π r3 Применим полученный результат для анализа тонкой структуры в спектре излучения атома Na. Электронная оболочка атома Na содержит электроны, распределенные по состояниям 1s2 2s2 2p6 3s1 (здесь верхние цифры выражают число электронов в названном состоянии). Валентный электрон 3s движется в поле остова атома, волновая функция состояния 3s сферически симметрична, поэтому распределение плотности вероятности состояния 3s также с высокой степенью приближения обладает сферической симметрией. Возбуждение электрона 3s происходит в процессе газового разряда, в результате которого валентный электрон 3s переходит в возбужденное состояние 3p. В состоянии 3p волновая функция, а также ее плотность вероятности сферической симметрией не обладают. Для учета влияния такой несфе∆ε = g l2
98
ричности необходимо в уравнение (2.8.3) вместо величины радиусвектора r ввести эффективный радиус-вектор rэф. Расчет показывает, что электронные слои атома 1s, 2s, 2p вращаются вокруг центра инерции с угловыми скоростями ω(1s, 2s) = 1,99·1017 рад/с, ω(2p) = 1,52·1017 рад/с, ω(2p) = 0,82·1017 рад/с, ω(3s) = 7,23·1015 рад/с или в относительных единицах ω(1s, 2s)/ω(3s) = 27,5, ω(2p)/ω(3s) = 21,0, ω(2p)/ω(3s) = 11,3. Таким образом, получается, что вся электронная оболочка атома вращается вокруг центра инерции, но при этом различные слои электронной оболочки вращаются с различными угловыми скоростями. А так как различие в угловых скоростях сравнительно невелико, то на движении валентного электрона сильнее всего влияет несимметричное распределение в пространстве распределение плотности вероятности электронов 2p-слоя. Распределение плотности вероятности 2p-электронов приближенно можно оценить при помощи угловых составляющих волновой функции ψ(θ, φ). Так как нас будут интересовать только состояния, не обладающие сферической симметрией, то состояниям 2p будут соответствовать квантовые числа ℓ = 1, m = 0, ±1, а сами волновые функции ψℓ,m(θ, φ) с учетом нормировки имеют следующий вид: ψ12,1 =
3 3 3 sin 2 θ, ψ12, 0 = cos 2 θ, ψ12, −1 = sin 2 θ. (8π) 2 ( 4 π) 2 (8π) 2
Тогда соответствующие плотности вероятности 3 3 3 sin θ ei ϕ , ψ1,0 = cos θ, ψ1, −1 = ψ1,1 = sin θ e − i ϕ , 8π 4π 8π их графики изображены на рис. 2.8.1. Вычислим общую площадь, ограниченную графиками плотности вероятности. Учитывая особенности расположения в пространстве pорбиталей, полная площадь сечения каждой орбитали будет складываться из 4-х площадей для ψ21,1 и 2-х площадей для ψ21,0.
ψ 12,1
ψ 12, 0
ψ 12, − 1
Рис. 2.8.1. Распределение плотности вероятности при ℓ = 1 для разных m
99
Площадь сечения π
π
4⋅3 2 2 3 ⎛ 1 1 ⎞2 3 − sin 2θ + θ ⎟ = S (ψ ) = sin θ dθ = , 2 ∫ 2⎜ (8 π) 0 16 π ⎝ 4 2 ⎠ 0 64 π 2 1,1
площадь сечения π
S (ψ12,0 )
π
4⋅3 2 3 ⎛1 1 ⎞2 3 2 cos d sin 2 . = θ θ = θ + θ⎟ = ⎜ 2 ∫ 2 2 ⎠ 0 16 π (4 π) 0 4π ⎝ 4
Полная площадь сечения всех 6-ти орбиталей 2p 9 S эф = 4 S (ψ12,1 ) + 2 S (ψ12, 0 ) = ; S 0 = π ⋅12 = π. 16 π Тогда величина эффективного радиуса остова атома Na rэф = (Sэф/ S0)1/2 = 0,239 r. Из опыта следует, что r = 0,1537 нм. Поэтому rэф = 0,239⋅ 0,1537=0,0367 нм. Подставим найденное значение эффективного радиуса в (2.8.3). После вычислений получаем ∆ε = 1,084·10-21 Дж = 6,78·10-3 эВ, что соответствует величине тонкого расщепления спектральной линии с длиной волны 589,0 нм ∆λ = 0,53 нм. Полученный результат сравним с опытом. Наиболее интенсивной у Na является желтая линия, возникающая при переходах 32P1/2 -32S1/2 и 32P3/2 -32S1/2. Этим переходам соответствуют длины волн 589,59 нм и 589,0 нм. Таким образом, опыт дает величину 0,59 нм, т.е. расхождение составляет 10%, что является хорошим результатом. Что же касается влияния релятивистского эффекта (в зависимости от скорости движения массы электрона) на величину тонкой структуры спектральной линии, то его роль настолько мала, что им можно пренебречь. Как следует из приведённого выше анализа, величина тонкого расщепления уровней полной энергии валентных электронов атомов порядка 10-3 эВ. На её величину может влиять увеличение радиусавектора r с ростом Z. Но это влияние столь мало, что оно существенно не сказывается на изменении величины ∆ε. Поэтому можно считать, что величина ∆ε, возникающая вследствие спин-орбитального взаимодействия, должна быть примерно постоянной. Формула (2.8.3) может иметь важное прикладное значение, так как по известной из опыта величине тонкой структуры она позволяет оценить геометрические размеры некоторых из атомов. Как показывает анализ, переход электрона из одного состояния в другое с учётом спин-орбитального взаимодействия активен в спектре
100
только в том случае, если при этом выполняются следующие правила отбора для квантовых чисел: ∆j = 0, ±1; ∆m = 0, ±1 . (2.8.4) На рис. 2.8.2, а показана схема разрешенных переходов для желтой линии Nа, а на рис. 2.8.2, б показаны разрешенные переходы в диффузной серии, на рис. 2.8.2, б спектральные линии выглядят более сложно, они состоят из трех близко расположенных компонент и называются сложным дублетом. Такая структура линии объясняет размытость линий диффузной серии.
3
2P
4 2D 5
2
3 2
4 2D 3
2
3 2P 3
3 2P 1
3 2S 3 2
2
2
3 2P 1
2
Рис. 2.8.2. Примеры разрешенных переходов в излучении натрия для главной (а) и диффузной (б) спектральных линий 2.9. Распределение электронов в атоме по слоям и состояниям
Закономерности распределения электронов в атомах по слоям и состояниям вытекают из принципа Паули. Этот принцип утверждает, что две тождественные частицы с одинаковым полуцелым спиновым квантовым числом (s=1/2, 3/2, 5/2 и т. д.) не могут одновременно находиться в одном и том же состоянии. Принцип Паули тесно связан с принципом тождественности, т.е. с принципом неразличимости одинаковых частиц. Электроны – тождественные частицы, у каждого из них нет индивидуальных признаков, индивидуальных особенностей, с помощью которых их можно различать между собой. Принцип Паули отображается при помощи антисимметричной волновой функции: при перестановке состояний двух электронов волновая функция должна изменить только знак. Таким образом, если два электрона находятся в одинаковых состояниях, то при антисимметричной волновой функции вероятность таких состояний равна нулю.
101
Как теоретически доказал Паули, любые частицы с полуцелым спиновым квантовым числом должны иметь антисимметричные волновые функции. Частицы с иным значением спинового квантового числа имеют симметричные волновые функции, и в одинаковых состояниях может находиться любое их число. С помощью принципа Паули можно объяснить строение электронных оболочек в атомах, ядерные оболочки и их структуру у атомных ядер, химическую связь молекул. В классической физике аналог принципа Паули отсутствует. Для определения в атоме состояния электрона необходимо задание 4х квантовых чисел. При этом каждое состояние определяется своим набором квантовых чисел. В соответствии с принципом Паули, в различных состояниях из 4-х квантовых чисел, хотя бы одно из них должно быть иным. Только в этом случае состояния электронов будут разными. Ранее было установлены возможные значения квантовых чисел и связь между ними: n = 1, 2, 3, ... , ∞; ℓ = 0, 1, 2, ... , n-1; m = mℓ = 0, ±1, ±2, ... , ± ℓ ; ms = ±1/2. Тогда в соответствии с принятой схемой получим следующий набор состояний и соответствующих квантовых чисел для каждого состояния: n = 1; ℓ = 0 ; mℓ = 0; ms = 1/2. Это состояние обозначается 1s, в нем может находиться не более 2-х электронов. В этом состоянии электрон обладает наименьшей энергией, электронное облако (плотность вероятности) обладает сферической симметрией. Электроны, заполняющие в атоме все s-состояния, образуют К-слой. Условная запись состояний заполненного К-слоя 1s2: 2s2; n = 2 ; ℓ = 0 ; mℓ = 0 ; ms = ±1/2 ; ℓ = 1 ; mℓ = 0, ±1 ; ms = ±1/2 ; 2p6 . Электроны 2s2 2p6 образуют L-слой, в нем содержится 8 электронов. n = 3 ; ℓ = 0 ; mℓ = 0 ; ms = ±1/2 ; 3s2 ; 3p6 ; ℓ = 1 ; mℓ = 0, ±1 ; ms = ±1/2 ; 3d10; ℓ = 2 ; mℓ = 0, ±1 ; ±2 ; ms = ±1/2; 2 6 10 Электроны 3s 3p 3d образуют М-слой, в нем содержится 18 электронов. 4s2 ; n = 4 ; ℓ = 0 ; mℓ = 0 ; ms = ±1/2 ; ℓ = 1 ; mℓ = 0, ±1 ; ms = ±1/2 ; 4p6 ; 4d10; ℓ = 2 ; mℓ = 0, ±1 ; ±2 ; ms = ±1/2; ℓ = 3 ; mℓ = 0, ±1, ±2, ±3 ; ms = ±1/2 4f14 .
102
Электроны 4s2 4p6 4d10 4f14 образуют N-слой, в нем содержится 32 электрона. Казалось бы, что все последующие слои должны заполняться в такой же последовательности. Но в действительности такой идеальный порядок заполнения слоев нарушается, хотя по-прежнему полностью заполненным слоем называется слой с ненарушенным порядком заполнения. Ниже приводится последовательность заполнения состояний при n ≥ 4: n = 4; 4s2 3d10 4p6 – всего 18 электронов; n = 5; 5s2 4d10 5p6 – всего 18 электронов; n = 6; 6s2 4f14 5d10 6p6 – всего 32 электрона; n = 7; 7s2 5f14 6d10 7p6 – всего 32 электрона. Такое отклонение в заполнении электронных оболочек от идеального при n≥ 4 вызвано особенностями в изменении энергии связи, которая, в свою очередь, определяет конфигурацию электронных оболочек атомов с большими Z. 2.10. Двухатомная молекула
Молекула, наименьшая часть данного вещества, является носителем его основных химических и физических свойств. Молекула может состоять из различных или одинаковых атомов, соединенных в единое целое химическими связями. Число атомов в молекуле может меняться от двух до сотен тысяч. Размеры молекул возрастают с увеличением числа входящих в них атомов от 0,1 нм до 100 нм и более. Молекулы представляют собой электрически нейтральные системы частиц. Химические и физические свойств молекулы определяется ее относительно слабо связанными внешними электронами. Вследствие того, что внутренние движения частиц в молекуле сложнее, чем в атоме, схема уровней энергий имеет более сложный вид: наряду с движением электронов относительно ядер могут происходить колебательное и вращательное движения с участием ядер. Поэтому полная энергия молекул с точностью до аддитивной постоянной, не меняющейся при химических превращениях, равна ε = ε эл + ε кол + ε вр , (2.10.1) где εэл – полная энергия электрона, εкол – энергия колебательного движения молекулы, εвр – энергия вращательного движения молекулы. Указанные энергии имеют следующие порядки величин: εэл ~ 1 эВ, εкол ~ (0,01 - 0,10) эВ, εвр ~ (0,01 - 0,10) эВ.
103
Между атомами молекулы существуют два основных вида связей (взаимодействий): ионная и ковалентная. Ионная связь возникает, когда молекулу можно представить состоящей из двух разноименно заряженных ионов. Например, молекула NaCl состоит из ионов Na+ и Cl-. Сила притяжения между такими ионами возникает как сила взаимодействия между разноименными зарядами и качественно достаточно просто может быть объяснена на основе классических представлений. На рис. 2.10.1 схематически изображена молекула NaCl. Известно, что радиусы нейтральных атомов Na и Cl соответственно равны 0,186 нм и 0,064 нм. Но после образования молекулы размеры ионов Na и Cl меняются и оказываются соответственно равными 0,098 нм и 0,133 нм. Na +
ρ F
ρ F
Cl −
Рис. 2.10.1. Возникновение сил притяжения между атомами в молекуле NaCl Физическая причина возникновения ионов Na+ и Cl- достаточно проста. Запишем распределение электронов у нейтральных атомов Na и Cl по состояниям: Na – 1s2 2s2 2p6 3s1; Cl – 1s2 2s2 2p6 3s2 3p5. Электроны 1s2 2s2 2p6 у атома Na образуют электронную оболочку атома инертного газа Ne. Эта оболочка полностью заполнена электронами, в результате связь электронов с ядром очень прочная. Такая оболочка сильно (на 10/11) экранирует электрическое поле ядра. Поэтому валентный электрон 3s слабо связан с ядром. Атому Cl для образования устойчивой оболочки инертного газа Ar недостает одного электрона. При образовании молекулы NaCl атом Cl присоединяет электрон, недостающий для полной застройки оболочки 3р. Эта связь также оказывается достаточно прочной. Между ионами молекулы возникает сила электрического притяжения, сближающая ионы до определенного расстояния, после чего между ними вследствие деформации электронных оболочек начинает действовать сила отталкивания между остовами атомов. Этот процесс динамический, он сопровождается периодической сменой сил притяжения силами отталкивания. В
104
результате атомы молекулы NaCl совершают непрерывные колебания. Колебания атомов в молекуле NaCl аналогичны колебаниям линейного гармонического осциллятора, рассмотренного нами ранее. Ковалентная связь возникает между нейтральными или одноименно заряженными атомами молекулы. С помощью законов классической физики ее возникновение объяснить нельзя, хотя качественное (наглядное) объяснение вполне возможно. Квантовая механика хорошо объясняет физическую причину ее возникновения на основе использования процесса обменного взаимодействия. В качестве примера рассмотрим роль ковалентной связи в процессе образования молекулы водорода. Молекула водорода – простейшая из возможных молекул. Ее простота позволяет достаточно наглядно проследить за отдельными этапами решения уравнения Шредингера, а также физическими выводами, вытекающими из него. Заметим, что примерно такими же методами решаются задачи и с многоэлектронными атомами, поэтому этот подход с чисто познавательной точки зрения для нас является очень важным и в дальнейшем будет использован неоднократно. ρ r1 A A
r12
1 ρ r2 A
2 ρ r1B
ρ r2 B B
R
Рис. 2.10.2. Обозначения межчастичных расстояний в молекуле Н2 Молекула водорода Н2 состоит из двух атомов, пусть это будут атомы А и В (рис.2.10.2). Составим уравнение Шредингера для системы частиц, входящих в состав молекулы водорода. (2.10.2) Hˆ ψ = εψ , ε – полная энергия молекулы, Ĥ – оператор Гамильтона молекулы.
105
Hˆ = Hˆ 1 + Hˆ 2 + U η2 e2 η2 e2 Hˆ 1 = − ∆1 − ∆2 − ; Hˆ 2 = − ; 2me 4 π ε 0 r1 A 2me 4 π ε 0 r2 B e2 e2 e2 e2 − + + ; 4 π ε 0 r1B 4 π ε 0 r2 A 4 π ε 0 r12 4 π ε 0 R Ĥ1, Ĥ2 – операторы Гамильтона атомов А и В ; r1, r2 – координаты первого и второго электрона; U – полная потенциальная энергия первого электрона при движении его вокруг ядра В, второго электрона при движении его вокруг ядра А, взаимодействия между электронами 1 и 2, взаимодействия между ядрами А и В. Волновая функция системы частиц ψ зависит не только от координат, но и от направлений собственных моментов импульса электронов. Для молекулы водорода могут реализоваться лишь два случая: а) собственные моменты импульсов параллельны, ρ ρ ρ ρ ρ Ls = Ls1 + Ls 2 = 2 Ls1 = 2 Ls 2 ; б) собственные моменты импульсов антипараллельны, ρ ρ ρ Ls = Ls1 + Ls 2 = 0. Для наглядности определения различных состояний атомов А и В присвоим каждому электрону свой номер. Тогда различным состояниям будет соответствовать различное расположение электронов. Здесь возможны два варианта, изображенные на рис. 2.10.3. Uˆ = U = −
1 2 A
2 1 B
A
B
Рис. 2.10. Два варианта расположения электронов в молекуле Н2 Задача решается методом последовательных приближений. Нулевое приближение. В этом приближении взаимодействия между частицами молекулы не учитываются, потенциальная энергия взаимодействия U= 0. Так как движение электронов в пространстве в указанном приближении происходит независимым образом, то вероятность такого сложного события будет равна произведению вероятностей каждого из них. Тогда в соответствии с рис. 2.10.3 можем записать
106
ψ12 = ψ 2A (1) ψ 2B (2) ;
ψ 22 = ψ 2A (2) ψ 2B (1)
или (2.10.3) Однако электроны представляют собой тождественные частицы, они физически неразличимы независимо от направлений собственных ρ ρ моментов импульсов Ls1 и Ls 2 , хотя различным направлениям собственных моментов импульса соответствуют различные состояния. Поэтому описание состояний только при помощи волновых функций (2.10.3) является недостаточным, поскольку они не учитывают наρ ρ правления в пространстве собственных моментов импульса Ls1 и Ls 2 . Для исключения неоднозначности обычно конструируют волновую функцию так, чтобы для одного случая она была бы четной, а для другого случая была бы нечетной. Тогда с учетом (2.10.3) можем записать: ψ s = c s (ψ1 + ψ 2 ) , ψ a = c a ( ψ1 − ψ 2 ) , (2.10.4) где ψs, ψa –- симметричная и антисимметричная волновые функции, причем симметричной функции соответствуют антипараллельные наρ ρ правления собственных моментов импульсов электронов LS 1 ↑↓ LS 2 , а антисимметричной функции – параллельные направления собственψ1 = ψ A (1) ψ B (2) ;
ψ 2 = ψ A (2) ψ B (1).
(
(
ρ
ρ
)
)
ных моментов импульсов электронов LS 1 ↑↑ LS 2 . По определению, полная энергия молекулы водорода для симметричных и антисимметричных волновых функций соответственно равна ε s = ∫ ψ*s Hˆ ψ s dV = ∫ ψ*s Hˆ 1ψ s dV + ∫ ψ*s Hˆ 2ψ s dV , ⎫⎪ (2.10.5) ⎬ ε a = ∫ ψ*a Hˆ ψ a dV = ∫ ψ*a Hˆ 1ψ a dV + ∫ ψ*a Hˆ 2ψ a dV ,⎪ ⎭ Для определения коэффициентов Cs и Ca в (4) используем условие нормировки: * * (2.10.6) ∫ ψ s ψ s dV = 1, ∫ ψ a ψ a dV = 1, После подстановки значений ψ s и ψ a из (2.10.4) в (2.10.6) получаем:
∫( ∫ (ψ
)( )(ψ
) )dV = 1.
C s2 ψ1* + ψ*2 ψ1 + ψ 2 dV = 1 Ca2
* 1
− ψ*2
1
− ψ2
(2.10.7)
Можно показать, что после интегрирования в (2.10.7) получим:
107
C = (2(1 + J s )) , C = (2(1 − J s )) ,
(2.10.8)
J s = ∫ ψ*A (2)ψ A (1)ψ*B (1)ψ B (2)dV ≠ 0 ,
(2.10.9)
2 s
−1
−1
2 a
где
J s – некоторое число. Первое приближение. В первом приближений учитывается взаимодействие между всеми частицами молекулы, поэтому полная потенциальная энергия молекулы U ≠ 0 . Теперь оператор Гамильтона Hˆ = Hˆ + Hˆ + U 1
2
Запишем уравнение Шредингера для каждого из электронов молекулы: Hˆ 1ψ s = ε1ψ s , Hˆ 2ψ s = ε 2ψ s , Обозначим ε1 = ε 2 = ε 0 – полная энергия электрона в каждом из изолированных атомов, т.е. в отсутствие взаимодействия между атомами. Тогда полная энергия молекулы, у которой собственные моменты импульсов электронов антипараллельны, равна (2.10.10) ε s = ∫ ψ*s Hˆ ψ s dV = 2ε 0 + ∫ ψ*sUψ s dV , причем здесь учтено, что * * * ∫ ψs Hˆ 1 + Hˆ 2 ψs dV = ∫ ψs (ε1 + ε2 )ψs dV = (ε1 + ε2 )∫ ψsψs dV = 2ε0 .
(
)
Аналогично получается выражение для полной энергии молекулы, у которой собственные моменты импульсов электронов параллельны: (2.10.11) ε a = 2ε 0 + ∫ ψ*aUψ a dV , Введем обозначения: ∆ε s = ∫ ψ*sUψ s dV , ∆ε a = ∫ ψ*aUψ a dV ,
(2.10.12)
где ∆ε s , ∆ε a – средние значения изменения полной энергии, возникающие в результате взаимодействия между атомами в молекуле. Отсюда (2.10.13) ε s = 2ε 0 + ∆ε s , ε a = 2ε 0 + ∆ε a После подстановки значений в (2.10.12) и выполнения промежуточных вычислений получаем: K + UJ s K − UJ s (2.10.14) ∆ε s = , ∆ε a = , 1+ Js 1 − Js где (2.10.15) K = ∫ ψ*A (1)ψ*B ( 2)Uψ A (1)ψ B ( 2) dV .
108
Интеграл K описывает так называемое обменное взаимодействие, его структура отображает физическую причину возникновения силы притяжения между атомами. Интеграл (2.10.15) относится к той области пространства, в которой электроны 1 и 2 одновременно принадлежат атомам А и В, т.е. находятся между ядрами. А так как электрические заряды электронов и ядер разноименны, то, находясь в пространстве между ядрами, они как бы притягивают ядра друг к другу (рис. 2.10.4).
1 A
B 2
Рис. 2.10.4. Модель возникновения сил притяжения между ядрами в молекуле Н2 Однако в пространстве между ядрами электроны могут находиться ρ ρ ρ ρ только в том случае, если LS 1 ↑↓ LS 2 . Если же LS 1 ↑↑ LS 2 , то электроны 1 и 2 в этом пространстве находиться не могут, так как в этом случае они находятся в одном и том же состоянии, что согласно принципу Паули запрещено. На рис. 2.10.5 изображены графики, поясняющие причину возникновения устойчивого состояния у молекулы водорода: состояния будут устойчивыми, если ε эл < 0 и имеется минимум энергии, отвечающий равновесному расстоянию между ядрами. Здесь R – расстояние между атомами. Электроны 1 и 2 в процессе движения вокруг ядер могут находиться не только между ядрами, но и за их пределами. В этом случае между ядрами возникает сила отталкивания. Значит, на ядра действуют знакопеременные силы, под влиянием которых ядра то сближаются, то удаляются друг от друга. В результате относительно центра инерции молекулы происходят колебания ядер, колебания атомов. Таким колебаниям должна соответствовать энергия колебательного движения ε кол . Анализ показывает, что, кроме этого, свободная молекула должна еще непрерывно вращаться вокруг своего центра инерции.
(
)
(
)
109
ε эп
∆εa 0
R0
R ∆ εs
D
Рис. 2.10.5. Энергия связи ядер в молекуле Н2 для устойчивой и неустойчивой конфигурации электронных спинов Полный момент импульса молекулы ρ ρ ρ L j = Lэл + Lя , L2j = η2 j ( j + 1) ,
(2.10.16)
где j – вращательное квантовое число, j = 1,2,3,... Зависимость эффективной потенциальной энергии взаимодействия между атомами от расстояния для устойчивых состояний всегда имеет минимум (рис. 2.10.6). Прочность связей атомов в молекуле определяется с помощью понятия энергии диссоциации D . Энергией диссоциации называется минимальная работа, которую необходимо совершить для разложения молекулы на атомы. Потенциальную энергию U(R) можно разложить в степенной ряд по r = R − R0 вблизи точки R = R0 , ограничиваясь только начальными членами разложения: dU 1 d 2U 2 1 d 3U 3 (2.10.17) U ( R) = U ( R0 ) + r+ r + r + ... dr 2 dR 2 6 dR 3 Здесь и в дальнейшем значения производных берутся в точке r = 0. В точке R = R0 функция U ( R) имеет минимум, ⎛⎜ dU ⎞⎟ = 0. ⎝ dr ⎠ R=R0 Если в (2.10.17) пренебречь четвертым слагаемым, то 1 d 2U 2 (2.10.18) U ( R) = U ( R0 ) + r . 2 dR 2 Так как энергия колебания относительно центра инерции молекулы
110
µω2 2 M ⋅ M2 M , r , µ= 1 M1 = M 2 = M = 2 2 M1 + M 2 M – масса ядра, то в (2.10.18) 1 d 2U µω2 = , 2 dR 2 2 где µ – приведенная масса молекулы, ω – собственная круговая частота колебаний ядер. Из (18) следует, что изменение потенциальной энергии молекулы µω2 2 ∆U ( R) = r = ε кол . 2 Таким образом, задача сведена к задаче о гармоническом осцилляторе с энергией 1⎞ ⎛ (2.10.19) ε кол = hν⎜ ν + ⎟, 2⎠ ⎝ где ν – колебательное квантовое число, ν = 0, 1, 2, 3,... . ε кол =
Заметим, что учет в (2.10.17) слагаемого
1 d 3U 3 r будет соответст6 dR 3
вовать ангармоническим колебаниям ядер. Атомы молекулы водорода все время вращаются вокруг центра инерции с кинетической энергии вращения η2 (2.10.20) ε вр = j ( j + 1), 2I I – момент инерции молекулы, j = 1, 2, 3,... . Медленное движение ядер приводит к расщеплению каждого электронного уровня на несколько дополнительных уровней, характеризующихся значениями квантовых чисел υ и j. Так как ε кол + ε вр ≤ D , то число таких уровней должно быть ограничено. Сравним теперь порядок величин всех трех слагаемых энергии молекулы. Полная энергия молекулы (2.10.21) ε = ε эл + ε кол + ε вр . Допустим, электроны, входящие в состав электронной оболочки молекулы, в какой-то промежуток времени локализованы вблизи R0 . Тогда неопределенность импульса в этой области пространства (∆r ≈ R0 )
111
η . R0 Для основного состояния электронной подсистемы молекулы можно принять неопределенность энергии примерно равной самой энергии: ∆ε эл ≈ ε эл Поэтому ∆p ≈
∆ε эл ≈
(∆p )2 2me
=
η . 2me R02
Приняв для оценки R0 = 1,06 ⋅ 10 −10 м , получим ∆ε ' эл = 3,4 эВ . Для оценки величины изменения энергии колебательного движения атомов положим в (2.10.19) u = 0 : ηω . (2.10.22) ∆ε кол ≈ ε кол = 2 Вблизи точки R = R0 между атомами, входящими в состав молекулы, действует квазиупругая сила, поэтому kr 2 µω2 r 2 (2.10.23) ε кол = = . 2 2 Следовательно, k ω= . µ Подставим найденное значение ω в (22): η2 k (2.10.24) . ε кол = 2 µ Так как 1 ⎛ d 2U ⎞ ∆U ( R) = ε кол = ⎜⎜ 2 ⎟⎟ r2, 2 ⎝ dR ⎠ R = R 0
то, как следует из (23), ⎛ d 2U ⎞ d2 K = ⎜⎜ 2 ⎟⎟ = dR 2 ⎝ dR ⎠ R= R 0
⎛ η2 ⎞ η2 ⎟ ⎜ 3 . = ⎜ 2m R 2 ⎟ me R04 ⎝ e ⎠ R = R0
Подставим значение K в (2.10.24): 3η2 1 me ε кол = = 3ε эл 2 µ 2 R0 meµ и после вычислений получаем ∆ε кол = ε кол = 0,2 эВ .
112
Вращательная энергия у слабовозбужденных атомов ( J = 1) η2 m (2.10.25) j ( j + 1) = 2ε эл e , 2 µ 2µR0 вычисления дают следующий результат: ∆ε вр = ε вр = 0,002 эВ ε вр =
Приведенные выше оценки хорошо соответствуют опытным данным. По физическому смыслу ε0 в (10) есть полная энергия электрона в атоме водорода, находящегося в основном состоянии. В нашем случае это ε эл . Тогда R 1 (2.10.26) ε 0 = ε эл = − , hc n 2 R – постоянная Ридберга, n = 1, 2, 3,..., n – главное квантовое число. С учетом (2.10.21), (2.10.22), (2.10.25) полная энергия молекулы водорода ⎛ ⎛ m ⎞ 1⎞ m (2.10.27) ε = ⎜⎜1 − ⎜ ν + ⎟ 3 e − 2 j ( j + 1) e ⎟⎟ε эл . 2⎠ µ µ ⎠ ⎝ ⎝ На рис. 2.10.6 приводится схема уровней энергии молекулы водорода. Из рис. 2.10.6 следует, что интервалы между соседними уровнями энергии колебательного и вращательного движений постепенно сближаются. А так как ε кол + ε вр ≤ D , то всегда существует определенная граница как для колебательных, так и для вращательных уровней. Из приведенных оценок видно, что интервал энергий между соседними уровнями очень мал. Поэтому отдельные спектральные линии оказываются физически неразличимыми и образуют полосы в спектре излучения. Возможность тех или иных переходов между отдельными уровнями молекулы водорода определяются правилами отбора для квантовых чисел: n – любое; ∆ν = ±1; ∆j = ±1 . (2.10.28) Из правил отбора (2.10.28) следует, что при переходе возбужденной молекулы в основное состояние на электронный спектр в (27), имеющий дискретный характер (см. (26)), накладываются спектры колебательных и вращательных переходов. В результате весь спектр представляет систему из нескольких групп полос, расположенных в различных участках спектра. Установленные выше результаты справедливы лишь при гармонических колебаниях ядер атомов, входящих в состав молекулы, т.е. при действии между ними квазиупругой силы. Но это будет справедливо
113
лишь при наличии малых отклонений ядер от положения равновесия. Если же отклонение от положения равновесия настолько велики, что сила взаимодействия будет отличаться от квазиупругой, то ε кол перестает выражаться формулой (2.10.19). В этом случае приближенно ее можно выразить формулой вида: 1 ⎞ 1 ⎞⎛ ⎛ (2.10.29) ε кол = hν⎜ υ + ⎟⎜1 − C1 (υ + ) ⎟ , C1 << 1. 2 ⎠ 2 ⎝ ⎠⎝ Поэтому с ростом колебательного квантового числа расстояние между соседними колебательными уровнями постепенно уменьшается, а так как максимальная энергия колебательного движения не может превышать энергию диссоциации, то число колебательных уровней всегда ограничено. Частота колебаний находится в инфракрасной области спектра. Так, у молекулы CO для υ = 1 λ = 4,67 мкм . n ε ε эл ε кол υ 4
3
2
1
6 4 2 0
6 4 2 0
6 4 2 0
Рис. 2.10.6. Схема электронно-колебательных уровней молекулы Н2 В заключение отметим, что вскрытые на примере атома водорода общие закономерности проявляются и у более сложных многоатомных молекул, но их детальный анализ более труден и не до конца завершен до сих пор. В общем же величины энергий электронного, колебательного и вращательного движений молекулы подчиняются соотношению µe µe , : ε эл : ε кол : ε вр = 1 : µ µ получившему название принципа Борна–Оппенгеймера.
114
Глава 3. ОСНОВЫ ФИЗИКИ ТВЕРДОГО ТЕЛА 3.1. Классификация твердых кристаллических тел В процессе образования твердого тела происходит перераспределение электронов у отдельных атомов, возникают силы, удерживающие атомы на определенном расстоянии друг от друга. Силы, связывающие между собой атомы в твердых телах, почти полностью электрические, роль магнитных и, тем более, гравитационных взаимодействий пренебрежимо мала. Твердое тело может состоять не только из отдельных атомов (ионов), но и из отдельных молекул. Силы, связывающие между собой молекулы в твердых телах, тоже в основном электрического происхождения. Однако межатомная связь в этом случае отличается от межмолекулярной: образование межатомной связи сопровождается существенной перестройкой электронной оболочки атомов, при межмолекулярном взаимодействии у каждого из атомов в основном сохраняется индивидуальная электронная оболочка. В твердом теле межатомные взаимодействия в основном осуществляются валентными электронами. Существуют три главных вида межатомных связей – ковалентная, ионная и металлическая. Физическая причина возникновения ковалентной и ионной связи нами была объяснена ранее. Напомним лишь, что ковалентная связь возникает в результате обменного взаимодействия электронами между соседними атомами, ионная связь обусловлена кулоновским взаимодействием между разноименно заряженными ионами атомов твердого тела. Любое научное направление в физике может успешно развиваться, только опираясь на правильные теоретические представления. Для физики твердого тела такой теоретической базой является квантовая механика, основы которой кратко были изложены ранее. Рассмотрим некоторые вопросы физики твердого тела. Цель нашего изложения заключается в объяснении особенностей электропроводности кристаллических твердых тел и возможности использования этих свойств в технике. В настоящее время все твердые тела по величине электропроводности делятся на четыре группы: металлы, полуметаллы, полупроводники и диэлектрики. По особенностям связей в твердых кристаллических телах их можно разделить на ионные, ковалентные, металлические и молекулярные кристаллы. У ионных кристаллов существует
115
кулоновская связь, связь между положительными и отрицательными ионами; ковалентные кристаллы возникают в результате наличия ковалентной связи между соседними ионами, когда, допустим, два электрона соседних ионов участвуют в образовании связи, а четыре электрона – в образовании заполненной электронной оболочки, причем они пространственно локализованы вблизи таких ионов и под действием электрического поля в пространстве направленным образом перемещаться не могут, а, следовательно, не могут создавать ток проводимости. Такая кристаллическая решетка, например, может быть образована атомами Si (рис. 3.1.1.). 3p
3p
3p
3p
3s
3p
3p
Si
Si
3p
3p 3s
3p
3p
3p
3p
Рис. 3.1.1. Ковалентная связь
X+
ρ F
−q
ρ F
X+
Рис. 3.1.2. Металлическая связь Металлические кристаллы возникают в результате металлической связи между ионами кристаллической решетки, связь эта осуществляется валентными электронами, т.е. электронами, которые в процессе возникновения кристаллической решетки, оторвались от соответствующих атомов. Теперь бывшие валентные электроны не локализованы в пространстве между соседними ионами кристаллической решетки, а свободно блуждают между ними – это свободные электроны. Связь между соседними ионами, металлическая связь, возникает по-
116
тому, что в пространстве между ними возникает эффективный отрицательный заряд, который стягивает между собой соседние ионы (рис. 3.1.2). Молекулярные кристаллы возникают только при низкой температуре под действием сил Ван-дер-Ваальса, т. е. в результате притяжения между соседними электрическими моментами диполей электрически нейтральных молекул (рис. 3.1.3). ρ ρ F F
−
−
+
+
Рис. 3.1.3. Дипольная связь Энергией связи называется энергия, которая выделяется при конденсации 1 моля вещества из газообразного состояния в твердое. Наиболее сильная связь существует у ионных кристаллов, самая слабая связь - у молекулярных кристаллов. В таблице 3.1.1 приводятся некоторые из свойств кристаллических твердых тел. Вид кристалла
Энергия связи
Ионные
1,0
Ковалентные
0,8
Металлические
0,4
Молекулярные
0,01
Электропроводность Незначительная ионная проводимость. Электронная проводимость отсутствует Полупроводниковая проводимость. Величина электропроводности зависит от концентрации примесей. Высокая электропроводность Диэлектрик
Типичные кристаллы
NaCl
Si
Ag , Cu H 2 , N2
Таблица 3.1.1. Некоторые свойства кристаллических твердых тел Твердые кристаллические тела могут иметь электронную и неэлектронную проводимость. Проводимость - это важнейшее свойство твердых тел, которое широко используется в технике. Поэтому в дальнейшем все наше внимание сосредоточим на таких веществах,
117
которые обладают этим свойством, т.е. на ковалентных кристаллах и на металлах. Но прежде чем приступить к описанию этих веществ, рассмотрим некоторые физические особенности каждого из приведенных в таблице 1 типов твердых тел в отдельности, считая, что энергия связи не является исчерпывающей характеристикой твердого состояния, более важной характеристикой является особенность образования связи в каждом типе кристаллической решетки. 3.1.1. Ионные кристаллы Обычно ионные кристаллы образуются из электроположительных и электроотрицательных атомов. Электроположительными называются атомы, легко теряющие электрон, электроотрицательными – атомы, прочно удерживающие присоединенный электрон. Электроположительными являются все атомы щелочных металлов, к электроотрицательным относятся атомы галогенов. Так в процессе образования ионного кристалла NaCl валентный электрон атома Na переходит к атому Cl , в результате возникают два противоположно заряженных иона Na + и Cl − . У каждого из возникших ионов возникают электронные оболочки, характерные для инертных газов. Наличие таких электронных оболочек у отдельных атомов ионной кристаллической решетки – одна из особенностей таких кристаллов. Ионы, входящие в состав кристаллической решетки, обладают сферической симметрией. Но радиус сфер у них разный. Так, радиус Cl − в кристалле NaCl почти в два раз больше радиуса Na + . Энергия связи ионных кристаллов в значительной мере определяется взаимным кулоновским притяжением таких заряженных сфер и силами отталкивания между одноименными зарядами ионов. Одновременное действие этих сил и определяет равновесное состояние атомов в кристалле. Валентные электроны электроположительного атома сильно связаны с электроотрицательными атомами, они локализованы вблизи отрицательных ионов и не могут участвовать в направленном переносе заряда в пространстве, т.е. не могут участвовать в образовании тока проводимости. Следовательно, такие кристаллы являются диэлектриками. Однако при высокой температуре атомы в таком кристалле обладают определенной подвижностью, под действием сильного электрического поля возникает электропроводность, вызванная направленным движением положительных и отрицательных ионов. Ионная проводимость во много раз меньше электронной. Частично это объясняется тем, что масса иона значительно больше массы электрона.
118
Если обратиться к кристаллу NaCl , то в этом кристалле более подвижными окажутся ионы Na + , у них меньший размер и меньшая масса, чем у ионов Cl − . Именно они и вносят основной вклад в перенос ионного заряда, в образование тока проводимости в кристалле. 3.1.2. Ковалентные кристаллы В процессе образования кристаллической решетки твердого тела всегда выделяется энергия. Если бы этого не было, то кристалл не мог бы находиться в устойчивом состоянии – в состоянии с минимальной энергией. Поэтому обратный процесс, процесс перехода вещества из твердого состояния в жидкое происходит при затрате энергии. Эта энергия в случае ковалентных кристаллов идет на разрушение ковалентных связей между соседними атомами. Типичными ковалентными кристаллами являются кристаллы, образованные атомами 4-ой группы периодической таблицы Менделеева: C, Si, Ge . В процессе образования кристалла электроны из состояний 2s, 3s, 4s переходят соответственно в возбужденные состояния 2p, 3p, 4p. 6 14
32
C 1s 2 2s 2 2 p 2 → 1s 2 2s1 2 p 3
Si 1s 2 2 s 2 2 p 6 3s 2 3 p 2 → 1s 2 2 s 2 2 p 6 3s1 3 p 3
Ge 1s 2 2s 2 2 p 6 3s 2 3 p 6 4 s 2 3d 10 4 p 2 → ...4 s1 4 p 3
Так, в Ge в результате выделения энергии электроны 4s возбуждаются, при этом один электрон переходит в состояние 4p, другой остается в состоянии 4s, но при этом настолько удаляется от ядра атома, что по отношению к 3d электронам он становится внешним, а электроны 4s 1 и 4 p 3 теперь оказываются валентными. Валентные электроны 4s 1 и 4 p 3 между соседними атомами кристаллической решетки образуют ковалентную связь. Каждая такая связь возникает в направлении наибольшей плотности электронной оболочки спаренных электронов, причем каждый атом решетки взаимодействует только с определенным числом соседних атомов, а не со всеми атомами решетки. Поэтому ковалентная связь является насыщенной, но направление связей не обязательно должно совпадать с направлениями ребер элементарной ячейки кристаллической решетки. Кроме Si и Ge, среди полупроводников широко используются атомы элементов III и V групп периодической системы элементов. Так, у
119 49
In валентными электронами являются электроны 5s 5 p , а у 2
2
1
51
Sb –
3
валентные электроны 5s 5 p . На первый взгляд кажется, что при переходе валентных электронов от In к Sb должна возникать ионная, а не ковалентная связь. Однако этого не происходит. Общее число валентных электронов у них 8, поэтому возникают четыре пары электронов, участвующих в образовании 4-х ковалентных связей, как и у Si или Ge. Ковалентные кристаллы при очень низких температурах – диэлектрики. Это связано с тем, что каждый валентный электрон за пределы связи, в которой он участвует, выйти не может, т.е. он локализован в пределах определенного микрообъема. Однако с повышением температуры некоторые из связей разрываются, возникают свободные электроны, которые могут участвовать в токе проводимости. Такой кристалл становится полупроводником, но из-за малости концентраций таких электронов электропроводность полупроводника всегда меньше электропроводности металла. 3.1.3. Металлические кристаллы При конденсации атомов из газообразного в жидкое, а затем и в твердое состояние всегда выделяется некоторая энергия. В результате в процессе образования металлического кристалла от атомов отрываются валентные электроны. А так как они не локализованы в пространстве вблизи каких-либо конкретных атомов, то такие электроны теперь принадлежат всем атомам кристалла, т.е. являются свободными. В металле концентрация свободных электронов порядка 10 29 м −3 . Под действием электрического поля внутри металла достаточно большое число электронов может участвовать в направленном переносе заряда, создавая ток проводимости. Так как число таких электронов очень велико, то и электропроводность металла всегда очень высокая. Электроны, участвующие в токе проводимости, называются электронами проводимости. Таким образом, металлическая связь основана на коллективизации валентных электронов всех атомов. Эти электроны, будучи не связанными с конкретными атомами, способны передвигаться по всему объему металла. Валентные электроны, если пренебречь взаимодействиями между ними, образуют нечто вроде электронного газа, подчиняющегося законам квантовой механики. В процессе перемещения свободные электроны некоторое время находятся между соседними атомами, находясь здесь, они создают эффективный отрицательный заряд, к которому притягиваются положительные ионы металла. Когда эффективный заряд убывает, сила притяже-
120
ния сменяется силой отталкивания между ионами. В результате ионы кристаллической решетки непрерывно колеблются. Таким образом, связь между атомами металла, металлическая связь, носит обменный характер и в этом у нее много общего с ковалентными кристаллами. 3.1.4. Молекулярные кристаллы Молекулярные кристаллы образованы молекулами, расположенными периодически в объеме твердого тела. Молекулярные кристаллы возникают при низких температурах под действием межмолекулярных связей, в них расстояние между молекулами r >> d , d – размер молекулы. Этим объясняется чрезвычайно малая величина взаимодействия между молекулами. Впервые такая связь была введена в физику Ван-дер-Ваальсом в 1873 году. Различают три вида этих сил: ориентационные, индукционные, дисперсионные. Как показывает анализ, потенциальная энергия взаимодействия у них зависит от расстояния по одному и тому же закону: A (3.1.1) U= 6 . r Ориентационные силы возникают между молекулами полярных диэлектриков как результат взаимодействия между молекулами, имеющими постоянные электрические моменты диполей. Индукционные силы возникают из-за того, что одна из молекул, обладающая электрическим моментом диполя, поляризует другую и индуцирует в ней электрический момент диполя. Дисперсионные силы возникают потому, что дипольный момент молекулы быстро и случайным образом меняется во времени, одновременно с ним меняются дипольные моменты соседних молекул. Поскольку каждая молекула такого кристалла электронейтральна, то молекулярные кристаллы являются диэлектриками, не обнаруживая ни электронной, ни ионной проводимости. Наиболее сильные взаимодействия из перечисленных – ориентационные и дисперсионные. 3.2. Основные особенности классической и квантовой статистики Любое твердое тело состоит из огромного числа микрочастиц, находящихся в непрерывном движении. Наиболее простой подход к выявлению физических закономерностей заключается в описании их
121
коллективных свойств. Этим, наряду с термодинамикой, занимается статистическая физика. Статистическая физика – это раздел физики, в котором изучаются физические свойства макроскопических тел, т.е. систем, состоящих из очень большого числа частиц (электронов, атомов, молекул) с учетом индивидуальных особенностей этих частиц и взаимодействий между ними. Так как твердое тело состоит из огромного числа взаимодействующих частиц, то для выявления особенностей его состояния применяют методы статистической физики, законы которой справедливы для большого массива движущихся частиц. Одним из важнейших свойств твердого тела является его электропроводность. Наибольшей электропроводностью обладают металлические и ковалентные кристаллы. Поэтому в дальнейшем будем рассматривать в основном два типа кристаллических твердых тел – ковалентные кристаллы и металлы. У них: 1) ионы в пространстве располагаются периодически; 2) в процессе кристаллизации вещества от каждого из атомов отрываются валентные электроны, в результате в объеме твердого тела возникают либо электронный Ферми-газ (ЭФГ), либо электронная Ферми-жидкость (ЭФЖ). Понятия ЭФГ, ЭФЖ тесно связаны с понятием свободных электронов, которое было введено в разделе 3.1. В отсутствие электрического поля свободные электроны движутся хаотически между ионами кристаллической решетки. Электрическое поле положительного заряда ионов в какой-то мере экранирует действие ближайшего свободного электрона на рассматриваемый свободный электрон. Следовательно, в первом приближении можно принять, что свободные электроны не взаимодействуют между собой. Такая система невзаимодействующих между собой электронов называется ЭФГ. По своим физическим свойствам ЭФГ во многом похож на идеальный газ. Основной отличительной особенностью его является наличие у свободного электрона электрического заряда и собственного момента импульса. ЭФЖ – это тот же ЭФГ, но в этой модели свободные электроны взаимодействуют между собой. В настоящее время теория ЭФГ достаточно хорошо разработана количественно, теория ЭФЖ разработана на уровне операторов, пользуясь этой теорией, количественные расчеты выполнить не удается. Главные особенности твердого тела определяются степенью различия концентраций свободных электронов и особенностями связи между атомами кристаллической решетки. На величину электропроводности решающим образом влияет концентрация свободных электронов,
122
которая очень сильно меняется у различных твердых тел. Так, у металлов концентрация свободных электронов порядка 1028–1029 м-3, у полупроводников – 1020–1022 м-3, а у диэлектриков – 1012–1014 м-3.. А так как удельная электропроводность твердого тела (3.2.1) σ = е⋅n⋅b , где e – заряд электрона, n – концентрация свободных электронов, b – подвижность электронов, то удельные электропроводности металла, полупроводника, диэлектрика отличаются между собой на порядки величин: σ м >> σ п п >> σ диэл . Напомним, что σ = ρ −1 , b =
v E
,
(3.2.2)
где ρ – удельное электрическое сопротивление, v – дрейфовая скорость, E – напряженность электрического поля в веществе. Свободные электроны твердого тела образуют систему частиц, обладающую целым рядом специфических свойств. Рассмотрим, в чем же состоит своеобразие свойств такой системы частиц по сравнению со свойствами частиц идеального газа. Указанную задачу, в принципе, можно рассмотреть совершенно строго, пользуясь при этом либо методами квантовой статистики, либо методами квантовой механики. При этом как в том, так и в другом случаях придется использовать теорию вероятности. Так для решения задачи методом квантовой механики необходимо описать движение каждого электрона, для чего необходимо составить столько уравнений Шредингера сколько электронов в системе. Кроме того, необходимо знать реальный потенциал взаимодействия между частицами твердого тела. Такая задача необычайно сложна, с ней может справиться только ЭВМ, да и то в отдаленном будущем. Поэтому в настоящее время для объяснения физических особенностей твердых тел в основном применяют методы физической статистики с использованием законов теории вероятностей. С помощью статистики многих частиц удается в среднем описать особенности движения всех свободных электронов ЭФГ в твердом теле. С энергетической точки зрения твердое тело будем рассматривать как потенциальную яму, в которой находятся свободные электроны ЭФГ. Каждый из них не связан ни с одним из атомов твердого тела, а принадлежит всей кристаллической решетке в целом. Свободные электроны в твердом теле по своим свойствам отличны от молекул идеального газа, отличны от свободных электронов в вакууме. Формально это проявляется прежде всего в том, что молекулы идеального
123
газа подчиняются классической статистике Максвелла-Больцмана, а свободные электроны твердого тела подчиняются квантовой статистике Ферми-Дирака. Сравним теперь основные особенности классической и квантовой статистик. 1. Статистика Максвелла-Больцмана имеет дело с частицами, движение которых в пространстве описывается законами классической физики, состояние частицы однозначно определяется заданием ее координат x, y, z и проекций импульса на координатные оси px, py, pz. Как координаты, так и одноименные проекции импульсов, в принципе, можно определить одновременно и совершенно точно. Поэтому в природе возможны состояния, бесконечно мало отличающиеся одно от другого координатами, импульсами, энергией. Эти состояния классическая физика считает не совпадающими между собой. Следовательно, любые два физически близкие состояния являются различными, и никаких ограничений на них при этом не накладывается, в том числе и на точность их определения. Больше того, возможно, что ∆px ∆x → 0 , поэтому в пределе может быть так, что ∆px = 0 и ∆x = 0 , т.е. в одном и том же состоянии могут находиться две и большее число частиц, и эти частицы будут физически различными. Если каждой из таких частиц присвоить свой номер, например, 1, 2, 3, . . . , то теоретически можно проследить за движениями этих частиц в пространстве. По-иному дело обстоит с электронами твердого тела. В общем случае свободные электроны твердого тела обладают и волновыми, и корпускулярными свойствами. Поэтому для них выполняется соотношение неопределенностей, и классический способ описания состояний здесь неприемлем. 2. Введем в рассмотрение понятие фазового пространства координат и импульсов. Фазовым пространством называется пространство, вдоль координатных осей которого откладываются не только геометрические величины, координаты частиц, но и физические величины, например, проекции импульсов на соответствующие координатные оси. Рассмотрим первоначально фазовую плоскость p x − x . Разделим все фазовое пространство на равные по величине площади и назовем их ячейками фазовой плоскости (рис. 3.2.1). При этом размер ячейки выберем равной постоянной Планка: ∆px ∆x = h . Пусть в двух соседних ячейках имеется по одному электрону. Тогда, по определению, эти свободные электроны будут находиться в
124
различных физических состояниях, если ∆px ∆x > h . Если же ∆px ∆x < h , то указанные два состояния будут восприниматься как одно и две частицы будут физически неразличимы. Итак, чтобы частицы были физически различимы, необходимо выполнение неравенства (3.2.3) ∆px ∆x ≥ h .
px
e1
∆p x
e2
∆p x
∆x
∆x
x
Рис. 3.2.1. Фазовые ячейки Следовательно, минимальный размер площади ячейки двумерного фазового пространства, соответствующий физически различным состояниям, равен h . Теперь рассмотрим остальные две плоскости фазового пространства, а именно, p y − y , p z − z . Для каждой из этих плоскостей минимальная площадь равна h . Поэтому минимальный объем ячейки шестимерного фазового пространства координат и импульсов, которому соответствуют еще физически различимые соседние состояния, будет равен h3 : dτmin = ∆p x ∆x∆p y ∆y∆p z ∆z min = ∆p x ∆p y ∆p z dV min . (3.2.4)
(
)
(
)
3. Предположим, что все фазовое пространство разбито на ячейки с минимальным объемом фазового пространства dτ min = h3 . В каждой ячейке может находиться большое число квантовых состояний, заполненных электронами. Такие состояния будут физически неразличимыми и будут восприниматься как одно состояние. Эти состояния являются вырожденными. Условие снятия вырождения – в каждой ячей-
125
ке должно быть одно состояние с определенными значениями квантовых чисел n, l, m, ms, и это состояние должно быть заполнено свободным электроном. Если же не все ячейки заполнены электронами, то, тем более, такие состояния будут невырожденными. 4. Число частиц в фазовом пространстве можно получить умножением коэффициента заполнения каждой ячейки на полное число ячеек, причем коэффициент заполнения ячейки определяется из дополнительных условий. Итак, если объем ячейки фазового пространства dτ ≥ h3 , то каждой ячейке будет соответствовать свое квантовое состояние, только в этом случае состояния свободных электронов будут физически различными. Поэтому в квантовой статистике фазовое пространство, в том числе и координатное, дискретно. В классической статистике фазовое пространство непрерывно, классическая статистика никаких ограничений на величину ячейки фазового пространства не накладывает, полагая, что они могут быть сколь угодно малыми. Заполнение состояний свободными электронами в твердом теле происходит в соответствии с принципом Паули, согласно которому в состоянии с полной энергией ε может находиться не более двух электронов с противоположно направленными собственными моментами импульсов. Поэтому в каждой ячейке фазового пространства может находиться не более двух электронов с противоположно направленными спинами. 5. В статистике Максвелла-Больцмана предполагается, что молекулы идеального газа можно, по крайней мере в принципе, различать между собой, перестановка местами двух молекул, находящихся в разных состояниях, приводит к возникновению нового микросостояния. В квантовой статистике Ферми-Дирака предполагается, что все свободные электроны тождественны. Поэтому перестановка электронов, находящихся в разных состояниях, не приводит к появлению нового микросостояния, эти состояния оказываются совпадающими. 3.3. Функция распределения Ферми-Дирака Функция Ферми-Дирака – это такая функция, с помощью которой вычисляется вероятность осуществления состояния частиц с полуцелым спиновым квантовым числом. Так, если параметром состояния является полная энергия, то функция распределения позволяет вычислить вероятность осуществления состояния с полной энергией ε.
126
Функция распределения Ферми-Дирака может быть использована для любой системы частиц, у которых спин s = (2k + 1)/2, k = 0, 1, 2, 3, . . . Такими частицами, например, являются электроны, нуклоны в ядрах атомов и другие. Если же s = k , то вероятность возможных состояний такой системы частиц вычисляется с помощью функции распределения Бозе-Эйнштейна. Примером таких частиц, в частности, являются фотоны. Пусть в объеме находятся частицы с полуцелым спином, например, свободные электроны. Движение хаотическое. Поэтому концентрация электронов в интервале энергий от ε до ε + dε будет dn = f n dε , а число возможных состояний в этом интервале энергий dz = f z dε . Обозначим концентрацию, приходящуюся на единичный интервал энергий, dn fn = , dε а концентрацию состояний в единичном интервале энергий dz . fz = dε По определению, функция распределения Ферми-Дирака равна числу электронов, приходящихся на одно квантовое состояние: dn fф−д = . (3.3.1) dz В объеме твердого тела V = const все фазовое пространство разделим на отдельные ячейки (рис. 3.3.1). py 1
2
3
4
•
•
i
•
•
•
λ−1
λ px
Рис. 3.3.1. Заполнение фазовых ячеек Так как полное число частиц и полное число состояний соответственно равны N = nV , Z = zV , то после подстановки n и z в (3.3.1) получаем:
127
dN . (3.3.2) dZ В формуле (3.3.2) N – большая, но ограниченная величина, Z – большая и неограниченная величина. Поэтому всегда N < Z . Минимальный объем ячейки фазового пространства, соответствующий физически различимым состояниям fф−д =
dτmin = h3 = dpdV , где
dp = dp x dp y dp z , dV = dxdydz . Выберем одну ячейку фазового пространства из общего числа ячеp x p y p zV ек λ = . В каждой ячейке пространства импульсов, согласно dpdV принципу Паули, может находиться не более двух электронов с противоположно направленными собственными моментов импульса, только в этом случае состояния электронов будут физически различными. Поэтому максимально возможное значение fp-d=2. Если учесть спиновое к4ватновое число как еще одну координату фазового пространства, то функция Ферми-Дирака ограничена сверху значением 1. Это ограничение математически выражает "индивидуализм" квантовых частиц с полуцелым спином, заключенный в принципе Паули. Отметим, что функция распределения бозонов (Бозе-распределение) не ограничена сверху: в одной фазовой ячейке может находиться множество бозонов. Каждой ячейке фазового пространства соответствует Z i состояние с энергией εi ; таким образом каждому номеру ячейки присваивается определенный номер состояния, например, i -ой ячейке соответствует Z i - состояние. Выделим в объеме V два вспомогательных объема V1 и V2 , мысленно разделив эти объемы вспомогательной перегородкой (рис. 3.3.2). Состояние макроскопического тела, состоящего из N частиц, можно определить с помощью термодинамических потенциалов, их изменение определяет направленность протекающего в системе частиц процесса. Если температура и объем все время сохраняются неизменными, то такое состояние характеризуется изохорно-изотермным потенциалом, он еще называется свободной энергией. Для незаряженных частиц свободная энергия
128
F =U −T ⋅S . (3.3.3) Здесь U – внутренняя энергия системы частиц, T – температура, S – энтропия системы частиц, S = k ln W + S0 , (3.3.4) W – термодинамическая вероятность осуществления данного макроскопического состояния системы частиц, k – постоянная Больцмана, S0 – значение энтропии системы частиц при T = 0 K. V = V1 + V2 , T = const •
•
•
•
•
•
•
•
•
•
•
• V1 • q1 • • • • • •
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
V2
q2
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Рис. 3.3.2. Термодинамическое равновесие Если теперь в объем ввести dN заряженных частиц с потенциальной энергией ε n , то в системе таких частиц произойдет изменение свободной энергии ⎞ ⎛ ∂U ⎞ ⎛ ∂U dFq = ⎜ + ε n ⎟dN − T ⋅ dS , (3.3.5) ⎟dN + ε n ⋅ dN − T ⋅ dS = ⎜ ⎠ ⎝ ∂N ⎝ ∂N ⎠ ∂U где + ε n = ε , ε – энергия частицы в определенном квантовом со∂N стоянии, ε n = q ⋅ ϕ , ϕ – потенциал электростатического поля. Применим эти понятия к системе свободных электронов твердого тела. Пусть в объеме V находятся свободные электроны, двигающиеся в пределах твердого тела хаотически. В процессе движения некоторое их число переходит границу раздела вспомогательных объемов V1 и V2 и попадает в соседний объем. Процесс обмена частицами контактирующих между собой объемов можно характеризовать электрохимическим потенциалом ⎛ ∂Fq ⎞ ⎟⎟ . (3.3.6) µ э = ⎜⎜ ⎝ ∂N ⎠V ,T При термодинамическом равновесии ( V = const ) электрохимические потенциалы в каждом из вспомогательном объеме равны между собой:
129
µ э1 = µ э 2 . Физический смысл этого равенства следующий: работа по переносу одной заряженной частицы из объема V1 в объем V2 равна работе по переносу другой заряженной частицы из объема V2 в объем V1 . Таким образом, получается, что при термодинамическом равновесии электрохимические потенциалы у системы заряженных частиц в пределах объема всюду одинаковы. ⎛ ∂Fq1 ⎞ ⎛ ∂Fq 2 ⎞ ⎟⎟ ⎟⎟ µ э = ⎜⎜ = ⎜⎜ . (3.3.7) ⎝ ∂N1 ⎠V ,T ⎝ ∂N 2 ⎠V ,T 1
2
После подстановки значения Fq из (5) в (6), получаем выражение для электрохимического потенциала в наиболее общем виде: ∂S , (3.3.8) µ = ε −T ∂N где ε – полная энергия частицы в i -м состоянии, S – энтропия системы частиц, вид ее определен в (3.3.4). Покажем, как электрохимический потенциал зависит от функции Ферми-Дирака. Для этого, прежде всего, найдем закон изменения термодинамической вероятности с изменением числа частиц N в системе. По определению, термодинамическая вероятность Z! W= . (3.3.9) (Z − N )! N ! Прологарифмируем W : ln W = ln(Z !) − ln((Z − N )!) − ln( N !) . Так как согласно постановке задачи Z !>> 1 , ( Z − N )!>> 1 , N !>> 1 , то для упрощения дальнейших вычислений применим формулу Стирлинга: ln(Z!) = Z ln Z ; ln((Z − N )!) = (Z − N ) ln(Z − N ) ; ln(N!) = N ln N , после чего получаем (3.3.10) ln W = Z ln Z − ( Z − N ) ln(Z − N ) − N ln N . Продифференцируем полученное выражение (3.3.10): Z Z−N ∂(Z − N ) − ∂ ln W = (ln Z )∂Z + ∂Z − Z Z−N N − (ln(Z − N ))∂(Z − N ) − ∂N − (ln N )∂N . N
130
Так как общее число состояний при заданной температуре не меняется, ∂z = 0 , то после несложных преобразований имеем: ∂ ln W ⎛Z ⎞ (3.3.11) = ln⎜ − 1⎟ . N ∂N ⎝ ⎠ Как следует из (3.3.3), S − S0 ln W = . k Отсюда ∂S ∂ ln W =k . ∂N ∂N ∂S Найденное значение с учетом (3.3.11) и (3.3.2) подставим в ∂N (3.3.8): ⎛Z ⎞ 1 µ э = ε − kT ln⎜ − 1⎟ = ε − kT ln f ф−−д − 1 . (3.3.12) ⎝N ⎠ Из (3.3.12) находим выражение для функции Ферми-Дирака:
(
)
−1
⎞ ⎛ ε −µ э f ф − д = ⎜ e kT + 1⎟ . (3.3.13) ⎟ ⎜ ⎠ ⎝ Напомним, что в (3.3.13) ε – энергия частицы в i -м состоянии, µ э – электрохимический потенциал заряженной частицы. Из (3.3.13) следует, что при T = 0 K функция Ферми-Дирака имеет вид ступеньки (рис. 3.3.3): ⎧1 ε ≤ µ э , fф−д T =0K = ⎨ ⎩0 ε ≥ µ э . f ф −д 1
0,5
ε 0
µэ
µ µ0
Рис. 3.3.3. Функция Ферми-Дирака
0
µ э0
131
Для конечной температуры распределение "расплывается", появляются свободные состояния при ε < µ э и занятые при ε > µ э . Область этого "расплывания" имеет пределы тепловой энергии kT. Поскольку интегрирование функции распределения по энергии дает полное число частиц, то площадь под кривой Ферми всегда постоянна и не зависит от температуры. Если ε − µ э >> kT , то f ф − д = e
−
ε −µ э kT
= f 0e
−
ε kT
.
Таким образом, при ε − µ э >> kT , т.е. при достаточно большой энергии, "хвост" функции распределения соответствует функции распределения Максвелла-Больцмана. Значит, в указанном интервале энергий частицы ведут себя как частицы идеального газа. Такой энергией, в частности, обладают термоэлектроны, свободные электроны, вылетевшие за пределы твердого тела. Поэтому для термоэлектронов можно использовать классическую статистику. Но для свободных электронов твердого тела, строго говоря, классическую статистику применять нельзя. 3.4. Квазичастицы в кристаллическом твердом теле
Квазичастицами называются наделенные свойствами частиц элементарные возбуждения, возникшие в твердом теле в результате внешних воздействий. В зависимости от особенностей внешних воздействий существуют различные виды квазичастиц: фононы, квазиэлектроны, плазмоны, поляроны, экситоны и другие. В настоящем параграфе будут рассмотрены физические причины возникновения и физические особенности только двух видов квазичастиц, наиболее важных для понимания дальнейшего изложения физики твердого тела. Остальные виды квазичастиц рассматриваются только в специальных разделах курса физики. 3.4.1. Фононы кристаллической решетки Атомы, находящиеся в узлах кристаллической решетки, при Т>0 К участвуют в тепловом движении, совершая непрерывные колебания около положения равновесия. Амплитуда колебаний ионов у большинства кристаллов не превышает 0,01 нм, что составляет (5–7)% от величины среднего расстояния между ионами кристаллической решетки. Но движение ионов при этом оказывается весьма сложным. Дело в том, что колеблющиеся частицы связаны между собой силами взаимодействия. У металлов это проявляется в виде металлической
132
связи, у молекулярных кристаллов – в виде молекулярной связи, у полупроводников – в виде ковалентной. Между ионами кристаллической решетки одновременно действуют силы притяжения и отталкивания. Если ионы изобразить в виде шариков, а силы взаимодействия заменить силой сжатой или растянутой пружины, то имеется определенное расстояние между ионами, на котором ионы будут находиться в положении равновесия. Грубая модель расположения таких ионов с указанием связей в кристаллической решетке изображена на рис. 3.4.1. ρ F
ρ F
Рис. 3.4.1. Квазиупругая модель кристалла: О – ионы кристаллической решетки; – сила взаимодействия между ионами кристаллической решетки (условным образом изображена пружина) Если один из ионов вывести из положения равновесия, например, ρ силой F , то его перемещение вызовет соответствующее перемещение ρ соседних ионов. Если теперь действие силы F прекратится, то левый ион (рис. 3.4.1) будет совершать колебания, которые вследствие существующих между ионами связями будут передаваться соседним ионам. В результате в кристалле возникает процесс распространения колебаний, т.е. возникает волна. В общем случае в кристалле могут возникать как продольные, так и поперечные колебания ионов. Возникшие волны, достигнув поверхности кристалла, отражаются от нее, в кристалле возникает сложная система стоячих волн. Это явление аналогично тому, какое происходит в закрепленной с двух сторон струне (рис. 3.4.2). В ней, как известно, могут возникать стоячие волны определенной длины, поскольку для возникновения стоячей волны необходимо, чтобы на длине струны укладывалось целое число длин полуволн. Собственная частота колебаний, с которой происходят колебания струны, зависит от силы натяжения, упругих свойств струны и ее линейных размеров. В кристалле также устанавливается набор стоячих волн, причем величина каждой длины волны зависит от размеров кристалла и его упругих свойств. Таким образом, природа тепловых упругих волн в
133
кристалле аналогична природе звуковых волн, поэтому их еще называют акустическими. Интервал частот тепловых волн очень широк – от 100 Гц до 1013 Гц.
Рис. 3.4.2. Стоячие волны Предельное значение длин тепловых волн в кристалле можно определить из следующих соображений. Изобразим плоскую модель кристалла, линейный размер которого ℓ. Из рис. 3.4.3а видно, что максимальная длина стоячей волны λmax= 2ℓ. Действительно, для того, чтобы на поверхностях кристалла при наибольшей длине волны λmax=2ℓ возникли узлы, необходимо, чтобы линейный размер кристалла был бы равен половине наибольшей длины волны.
λ
4d
а б Рис. 3.4.3. Определение максимальной (а) и минимальной (б) длин волн Минимальная длина волны λmin может быть определена из рис. 3.4.3б. На нем изображена стоячая волна, которая охватывает 4 межатомных расстояния. Поэтому λmin = 4d, где d – постоянная кристаллической решетки. Скорость распространения тепловых волн совпадает со скоростью звука в кристалле, а энергия колебаний распределяется между всеми видами волн. Но, так как короткой длине волны соответ-
134
ствует наибольшая частота колебаний, то наибольшая энергия приходится на короткие волны. Как следует из квантовой механики, энергия колебаний ионов должна быть дискретной, т.е. квантована. Квант энергии тепловых колебаний ионов кристаллической решетки называется фононом и равен εФ = h ν , (3.4.4.1) где ν – частота колебаний ионов. Фононы, т.е. распространяющиеся в кристалле элементарные возбуждения, наделяются свойством частиц и называются квазичастицами. Они являются элементарными носителями движения в системе реальных частиц, входящих в состав кристаллической решетки, и связаны между собой взаимодействием. В газах частицы одновременно выполняют две функции: они являются элементарными кирпичиками вещества, тем самым выполняя функцию структурной единицы материи, и одновременно являются элементарными носителями движения в этой системе частиц. Таким образом, в газах элементарный носитель движения и структурная единица материи совпадают между собой, образуют единое целое. В твердом теле эти две функции разделены: ионы являются структурными единицами материи, а фононы являются структурными единицами движения, с их помощью переносится колебательная энергия. В процессе движения в кристалле фононы сталкиваются между собой и при этом рассеиваются. Рассеяние также происходит при столкновении фонона с дефектом кристаллической решетки. Система не взаимодействующих между собой фононов образует фононный газ, свойства его соответствуют статистике БозеЭйнштейна, функция распределения которой −1
⎞ ⎛ ε ⎟ ⎜ kT f Б − Э = ⎜ e − 1⎟ . ⎟ ⎜ ⎠ ⎝ Если рассматривать распространение волны в кристалле, то процесс распространения колебаний можно представить в виде цепочки ионов, в которой некоторое число ионов отклонилось от положения равновесия (рис. 3.4.4). Если в направлении между наибольшим сближением ионов движется электрон, то он столкнется с таким сближением и при этом либо отдаст часть своей энергии, либо получит от решетки некоторую ее величину.
135
На рис. 3.4.4 представлен наглядный образ фонона – кванта энергии теплового колебания ионов кристаллической решетки.
e
ρ v
me
Рис. 3.4.4. Взаимодействие электрона с фононами Приравняем среднюю энергию колебательного движения, приходящуюся на одну степень свободы, энергии одного фотона: kT = hν. (3.4.1.2) В уравнении (3.4.1.2) частота колебаний иона кристаллической решетки зависит от температуры. Тогда максимальной температуре будет соответствовать максимальная частота колебаний: (3.4.1.3) ν max = ν (Tmax ) . Частота колебаний ионов кристаллической решетки охватывает большой интервал частот, но среди возможных частот всегда имеется минимальная частота ν min и максимальная частота ν max . А так как для фононов, обладающих наибольшей энергией, справедлива зависимость (3.4.1.2), то можно записать: ⎛ kT ⎞ kθ ⎜⎜ ⎟⎟ (3.4.1.4) = 1, = h ν h ν ⎝ ⎠ν max max где θ – температура Дебая.
θ=
hνmax . k
(3.4.1.5)
Для одномерного кристалла температура Дебая легко вычисляется. Действительно, колебания в кристаллической решетке распространяются со скоростью звука: vзв = λ min ⋅ νmax = λ min / Tmin , Tmin – период колебаний. Отсюда v v ν max = зв = зв . (4.3.1.6) λ min 4d После подстановки νmax из (3.4.1.6) в (3.4.1.5) получаем:
136
h v зв . (3.4.1.7) 4k d Для трехмерных кристаллов следует учесть, что колебания ионов можно разложить на 3 составляющие. Тогда θ в (3.4.1.7) есть температура Дебая для одной составляющей колебаний, а максимальная энергия фонона с учетом 3-х составляющих колебаний будет равна (3.4.1.8) 3 hν max = θ x, y , z . θ=
Отсюда в общем случае температура Дебая равна 3 h v зв θ x, y , z = . (3.4.1.9) 4k d В качестве примера вычислим температуру Дебая для кристаллов Cu и NaCl, у которых скорости звука соответственно равны 3550 м/с и 4400 м/с, а постоянные кристаллической решетки 3,60Å и 5,63Å. В результате вычислений по формуле (3.4.1.9) получаем значения температур Дебая для Cu θ=354 K, для NaCl θ=281 К. Ниже в таблице приведены экспериментальные значения для некоторых веществ. Вещество
Au
Cu
Ge
NaCl
θэкс , K
170
315
290
280
Анализ таблицы показывает, что в кристаллах имеют место как продольные, так поперечные колебания, причем у Au преобладающими являются продольные, а у Cu – поперечные колебания. При температуре Т = θ в твердом теле возбуждается весь спектр колебаний с максимальной частотой νmax. Поэтому дальнейшее повышение температуры Т > θ не вызовет появление колебаний с новыми частотами, дальнейшее нагревание приводит лишь к увеличению амплитуды колебаний и соответствующему увеличению колебательной энергии. При Т < θ с ростом температуры увеличивается νmax, увеличивается спектр возможных частот колебаний. При Т > θ кристалл называется горячим, при Т < θ – холодным. Тогда температура Дебая есть граница раздела между горячим и холодным состояниями, но и в том, и в другом случаях амплитуда колебаний увеличивается с ростом температуры. Рассмотренные колебания ионов называются акустическими. Однако, когда элементарная ячейка кристалла содержит несколько атомов, то наряду с акустическими возникают оптические колебания.
137
3.4.2. Квазиэлектроны кристаллической решетки Ранее было показано, что движение электрона в вакууме можно представить в виде двух волновых функций, одна из которых отображает волновые свойства материи, другая – корпускулярные: ρρ − i (ω t − k r )
ρρ i − (ε t − p r ) η . = ψ0 e
(3.4.2.1) Таким образом, каждой движущейся частице с энергией ε и имρ пульсом p можно сопоставить некоторый волновой процесс. Из (1) ρ ρ следует, что ε = η ω и p = η k , ω – круговая частота колебаний волноρ вой функции, k – волновой вектор, ω = 2πν, k = 2π/ λ. Эти же представления можно распространить и на свободные электроны в кристаллическом твердом теле. Пусть первоначально свободные электроны не взаимодействуют между собой, т.е. в твердом теле существует ЭФГ. Возможные состояния электронов ЭФГ определяются набором уровней полной энергии. Эти состояния, в принципе, могут быть получены в результате решения уравнения Шредингера. Однако при наличии внешнего воздействия, в частности, при нагревании твердого тела, происходит возбуждение свободных электронов твердого тела, а, следовательно, и изменение у каждого из них полной энергии. Если такие возбуждения достаточно малы, то полная энергия системы свободных электронов будет складываться из энергии их основных состояний и энергии отдельных элементарных возбуждений: ψ = ψ0 e
N
N
i =1
i =1
ε = ∑ ε i + ∑ ∆ε i .
(3.4.2.2)
В результате элементарного возбуждения у каждого электрона увеличивается импульс, а стало быть и скорость движения в кристаллической решетке, т.е. элементарное возбуждение каким-то образом связано с изменением динамической характеристики движения частицы – импульса. Возбужденное состояние, возникающее в твердом теле, не остается локализованным, а в результате взаимодействия между частицами распространяется в виде волны. Возбуждения каждого из свободных электронов незначительны по величине. Они называются элементарными и наделяются свойствами частиц. Но так как возбуждения – это не реальные, а воображаемые частицы, то такие элементарные возбуждения называются квазичастицами. Они обладают квазиρ импульсом η k , энергией ε = ηω и спиновым квантовым числом s=1/2. Квазичастицы во многом подобны элементарным частицам, но они
138
никогда не могут возникать в вакууме. Дело в том, что для их возникновения обязательно требуется наличие вещества, состоящего из способных возбуждаться структурных элементов материи. В этом случае квазиэлектроны являются элементарными носителями движения. Квазичастицы (квазиэлектроны) также имеют массу, но для них понятие массы является условным: масса квазичастицы не обладает ни гравитационными, ни инерционными свойствами. Система невзаимодействующих между собой квазиэлектронов образует ЭФГ, для которого справедлива функция распределения Ферми-Дирака: −1
⎛ ε −µ 0 ⎞ ⎜ ⎟ fФ − Д = ⎜ e k T + 1⎟ , (3.4.2.3) ⎜ ⎟ ⎝ ⎠ где ε – энергия квазиэлектрона, µэ – их электрохимический потенциал. Для дальнейшего объяснения физических свойств кристаллического твердого тела необходимо ввести в рассмотрение поверхность Ферми. Поверхностью Ферми называется поверхность с постоянной полной энергией, равной энергии Ферми, построенная в пространстве квазиимпульсов, отделяющая область занятых электронных состояний от области состояний, в которой при Т = 0 К электронов нет. Большинство свойств кристаллического твердого тела определяют электроны, расположенные на поверхности Ферми и в узкой области пространства квазиимпульсов вблизи нее. Каждый металл характеризуется своей поверхностью Ферми, причем форма поверхности весьма разнообразная и, как правило, очень сложная. Но для ЭФГ поверхность Ферми сферическая, что сильно облегчает проведение конкретных расчетов. Электроны проводимости твердого тела являются квазичастицами. Приставку "квази-" электроны проводимости получили потому, что законы их движения в твердом теле сильно отличаются от законов движения в вакууме. Движение электрона проводимости можно представить себе как движение в сопровождении облака других частиц, поскольку в процессе движения за электроном возникает область эффективного положительного заряда, также перемещающегося вместе с ним. Это приводит к изменению зависимости между энергией и импульсом электрона. У электрона проводимости структурная единица материи, электрон, совпадает со структурной единицей движения, ρ квазиэлектроном. Ввиду сложного вида закона дисперсии ε = ε( p) для
139
наглядности квазиэлектроны удобно располагать над поверхностью Ферми в непосредственной близости от нее, тогда свободные уровни полной энергии будут располагаться в объеме, ограниченном поверхностью Ферми. К возбужденным состояниям свободных электронов металла понятие квазиэлектрона имеет двойное применение. Иногда под словом "свободные электроны" подразумевают квазиэлектроны, тем самым подчеркивая, что электроны в процессе движения возбуждаются. При такой трактовке число квазиэлектронов всегда равно числу свободных электронов и не меняется с изменением температуры. Однако чаще квазиэлектронами называют элементарные возбуждения, которые характеризуются появлением электрона за пределами поверхности Ферми, а освободившееся от электронов уровни полной энергии наделяются свойствами частиц и называются дырками. В этом случае квазичастицы рождаются парами и в пространстве не совпадают между собой. Заметим, что под дырками понимают незаполненное электроном состояние с энергией ε < εФ , εФ – энергия Ферми. 3.5. Распределение свободных электронов по энергиям
Свободный электрон в твердом теле представляет своеобразное сочетание двух понятий – структурной единицы материи и структурной единицы движения, причем структурная единица движения – элементарное возбуждение электрона, квазиэлектрон. Структурные единицы материи и движения у свободных электронов совпадают, образуя единое целое. Из этого, в частности, следует, что свободный электрон имеет заряд, энергию, квазиимпульс и массу. Но масса эта необычная, она не является носителем инерционных и гравитационных свойств, т.е. она не является ни динамической характеристикой движущейся частицы, ни материальной. Поэтому масса свободного электрона в твердом теле называется эффективной массой, ее физическое содержание мы раскроем в дальнейшем. Для изучения электрических, магнитных, тепловых и других свойств твердого тела необходимо знать распределение электронов по энергиям. Установим вид распределения при постоянной эффективной массе свободного электрона (m* = const). Предположим, что свободные электроны не взаимодействуют между собой. Значит, в твердом теле существует ЭФГ. Подсчитаем число возможных состояний свободных электронов в пространстве импульсов.
140
Число ячеек в объеме 6-мерного фазового пространства координат и импульсов может быть найдено как частное от деления всего объема фазового пространства на минимальный объем ячейки фазового пространства. Среда изотропная, поэтому поверхность Ферми сферическая. Следовательно, любое направление движения свободного электрона является равновероятным. Кроме того, распределение свободных электронов в геометрическом пространстве равномерное. Тогда при выборе фазового пространства можно рассматривать весь объем. ρ Пусть свободный электрон имеет импульс в интервале от p до ρ ρ p + dp (рис. 3.5.1). Распределение электронов по геометрическому объему V равномерно. Py
ρ dPy
ρ P
0
ρ dP
ρ dPx
Px
Рис. 3.5.1. Импульсное пространство Тогда число ячеек в объеме фазового пространства координатимпульсов будет dpx dp y dpz V dp3 ⋅V = . dN я = h3 h3 Число ячеек в единице объема геометрического пространства в выделенном объеме пространства импульсов dp3 = dpx·dpy·dpz (рис. 3.5.2) d N я dp = 3. V h Тогда число свободных электронов в единице объема геометричеρ ского пространства, импульсы которых находятся в интервале от p ρ ρ до p + dp , с учетом принципа Паули будет
141
dp 2 dГ я fф − д = 2 fф − д 3 , V h где fф-д – вероятность заполнения ячейки свободным электроном, функция Ферми-Дирака. dn =
pz ρ dp z
ρ dp ρ dpx
ρ dp y
py
px Рис. 3.5.2. Объем в импульсном пространстве
Полученное выражение для концентрации свободных электронов справедливо лишь для заданного направления импульсов. Однако в отсутствие внешних электрических и магнитных полей движение свободных электронов в кристаллической решетки твердого тела хаотично и в любом направлении равновероятно. Таких элементарных объемов в разных направлениях пространства импульсов можно построить бесчисленное множество. Совокупность таких элементарных объемов на одном и том же расстоянии пространства импульсов образует шаровой слой толщиной dp (рис. 3.5.3). py
ρ ρ dp p 0
Рис. 3.5.3. Шаровой слой
px
142
Объем такого шарового слоя dV p = 4π p 2 dp , а концентрация ячеек
в пределах выделенного шарового слоя пространства импульсов 4π p 2 dp dN я = . h3 Тогда концентрация свободных электронов в шаровом слое пространства импульсов 8 π p 2 dp (3.5.1) fФ − Д . dn = 2 fФ − Д dN я = h3 Перейдем теперь от пространства импульсов к пространству энергий и найдем концентрацию свободных электронов в интервале энергий от ε до ε + dε. Свободные электроны находятся в электрическом поле кристаллической решетки и потому обладают потенциальной энергией. Кинетическая энергия свободного электрона p2 K = ε −U = 2m * или p 2 = 2m * (ε − U ) , (3.5.2) где U – потенциальная энергия свободного электрона в твердом теле, m* – эффективная масса электрона. Перенесем начало отсчета энергии на дно потенциальной ямы, положив K = ε > 0. Тогда, как следует из (3.5.2),
p 2 = 2m * ε , 2
1 22
3 ( m*) 2
1 ε2
3
1
p dp = dε . (3.5.3) Отсюда после подстановки найденных значений в (3.5.1) имеем: 4 π (2m*) 2 ε 2 dε dn = . (3.5.4) ⎛ ε − µ ⎞⎞ 3⎛ h ⎜⎜1 + exp⎜ ⎟ ⎟⎟ ⎝ kT ⎠ ⎠ ⎝ Следует обратить внимание, что в показатель степени уравнения (3.5.4) входит не µэ , а µ. Это связано с тем, что теперь начало отсчета энергии находится на дне потенциальной ямы. Тогда концентрация
143
свободных электронов в интервале энергий от 0 до ∞ может быть определена после вычисления интеграла 3 1 ∞ 4 π (2m*) 2 ε 2 dε . n= 3 (3.5.5) ⎛ε−µ⎞ h 1 + exp⎜ ⎟ 0 ⎝ kT ⎠ Верхний предел ε = ∞ выбран из тех соображений, что при ⎛ε−µ⎞ ε−µ ⎟⎟ >> 1 , и поэтому без заметной ошибки >> 1 величина exp⎜⎜ kT ⎝ kT ⎠
∫
можно положить εmax = ∞. Если принять, что m* = const, то интеграл (3.5.5) является табличным, и тогда концентрация свободных электронов зависит от температуры, эффективной массы и химического потенциала: 3
2 3 8 π(2m*) 2 2 ⎛⎜ π 2 ⎛ k T ⎞ ⎞⎟ ⎟ . ⎜ n= µ 1+ ⎜ 8 ⎜⎝ µ ⎟⎠ ⎟ 3 h3 ⎝ ⎠
(3.5.6)
Пусть kT << 1 . Как станет ясно из дальнейшего, для металлов это µ условие всегда выполняется. Уравнение (3.5.6) запишем для Т=0 К, при этом 3
2
3
8 π (2m*) 2 h2 ⎛ 3n ⎞ 3 2, µ = n= ⋅ µ ⎜ ⎟ , (3.5.7) 0 0 8m * ⎝ π ⎠ 3 h3 где µ0 – химический потенциал при Т = 0 К. В качестве примера вычислим химический потенциал Cu. У меди n = 8,4·1028 м-3, m* = = 9,1·10-31 кг. После подстановки значений n и m* в (3.5.7) и последующих вычислений получаем µ0 = 6,98 эВ, что хорошо соответствует экспериментальному значению. Из (3.5.7) находим 3
3
− 8 π (2m*) 2 2 = n µ 0 . 3 h3 После подстановки (3.5.8) в (3.5.6) получаем
⎛ π 2 ⎛ kT ⎞ 2 ⎞ ⎜ ⎟ ⎟ µ = µ 0 ⎜1 + ⎜ 8 ⎜⎝ µ ⎟⎠ ⎟ ⎝ ⎠
−
(3.5.8)
2 3
.
(3.5.9)
144 2
Так как второе слагаемое ⎛⎜⎜ kT ⎞⎟⎟ << 1 , то после разложения в степен⎝ µ ⎠
ной ряд с большой точностью получаем: ⎛ π 2 ⎛ kT ⎞ 2 ⎞ ⎜ ⎟ ⎟. (3.5.10) µ = µ 0 ⎜1 − ⎜ 12 ⎜⎝ µ ⎟⎠ ⎟ ⎝ ⎠ Оценим, насколько µ отличается от µ0, при µ0 = 6,98 эВ и различных температурах. Результаты таких вычислений приведены в таблице. Т, К
120
600
1200
2400
kT, эВ
0,01
0,05
0,10
0,20
µ , эВ
6,97999
6,97970
6,97880
6,97528
Из результатов вычислений по формуле (3.5.10) следует, что с большой точностью µ = µ0 . Поэтому с целью простоты дальнейших расчетов можно записать: ⎛ π 2 ⎛ kT ⎞ 2 ⎞ ⎜ ⎟ ⎟. µ = µ 0 ⎜1 − (3.5.11) ⎜ 12 ⎜ µ ⎟ ⎟ 0 ⎠ ⎝ ⎝ ⎠ Итак, из приведенной таблицы следует, что изменение химического, а стало быть и электрохимического потенциала настолько незначительно, что ими можно пренебречь. Распределение концентраций свободных электронов по энергиям получим из (3.5.4):
dn = dε
3 4π(2m*) 2
1 ε2
. (3.5.12) ⎛ ⎛ ε − µ ⎞⎞ ⎟ h3 ⎜⎜1 + exp⎜ ⎟⎟ ⎝ kT ⎠ ⎠ ⎝ Графики этой функции приведены на рис. 3.5.4. Заметим, указанное распределение справедливо лишь для ЭФГ только для изотропного твердого тела. Из рис. 3.5.4 следует, что распределение уровней полной энергии свободных электронов в потенциальной яме неравномерно. Наибольшее число занятых уровней находится вблизи энергии Ферми, а вдали от нее число занятых уровней полной энергии резко убывает.
145
y
dn dε
МЕТАЛЛ
T=0K
ε
x T>0K
T>0K
x
εФ
µ µ0
ε
dn dε
µ
0
а
б
Рис. 3.5.4. Распределение электронов по энергиям 3.6. Явление сверхпроводимости
Явление сверхпроводимости впервые было обнаружено в 1911 г. голландским физиком Каммерлинг-Оннесом при исследовании зависимости электрического сопротивления ртути от температуры. В результате проведенных опытов им было установлено, что при температуре Т = 4,2 К электрическое сопротивление ртути уменьшается практически до нуля. В 1913 г. за исследования физических свойств веществ при низких температурах, а также за разработку способа получения жидкого гелия ему была присуждена Нобелевская премия по физике. Однако разумного физического объяснения этому явлению ни ему, ни другим ученым того времени получить не удавалось. Причина возникших трудностей состояла в том, что сверхпроводимость – сугубо квантовое явление, возникающее в результате Бозе-конденсации пар электронов проводимости. Лишь после того, когда это установили, удалось объяснить это явление. В 1957 г. Бардиным, Купером и Шриффером (БКШ) был разработан первоначальный вариант микроскопической теории сверхпроводимости. Сверхпроводимость довольно распространенное в природе явление: оно наблюдается у чистых металлов, металлических сплавов и соединений, у некоторых полупроводников. Перечислим важнейшие свойства сверхпроводников.
146
1. Отсутствие электрического сопротивления протекающему постоянному току при температуре ниже критической Тк. 2. Выталкивание внешнего магнитного поля из объема сверхпроводника (эффект Мейснера). На рис. 3.6.1а изображено сечение проρ водника, помещенного во внешнее магнитное поле B при температуρ ре Т>Тк. Видно, что векторные линии индукции магнитного поля B пронизывают сечение проводника. Однако, если температура вещества будет ниже Тк, то вещество переходит в сверхпроводящее состояние, при этом внешнее магнитное поле уже не проникает в сверхпроводник, происходит выталкивание магнитного поля из сверхпроводника (рис. 3.6.1.б). Значит, при Т < Тк в объеме сверхпроводника магнитное поле отρ ρ сутствует, а так как B = µ 0 (1 + χ m ) H , χ m – магнитная восприимчивость вещества, то χ m = −1, µ = µ 0 (1 + χ m ) = 0 . Следовательно, при таких условиях сверхпроводник ведет себя как идеальный диамагнетик.
Tк ≤ T
ρ B T > Tк
а Рис. 3.6.1. Эффект Мессбауэра
ρ B
χ m = −1
χ m>1
б
3. Существование предельного значения индукции внешнего магнитного поля ВK и предельного значения плотности тока сверхпроводимости jк, при превышении которых сверхпроводимость в веществе исчезает. Согласно теории БКШ, между электронами проводимости действуют не только кулоновские силы отталкивания; при определенных условиях между некоторыми из них возникает сила притяжения. Физическая причина возникновения силы притяжения следующая. Свободный электрон, двигающийся в кристаллической решетке, притягивает к себе положительно заряженные ионы, тем самым несколько сближая их между собой. В результате такого уплотнения в расположе-
147
нии ионов в пространстве возникает избыточный положительный заряд, коррелированный с движущимся электроном. К такому положительному заряду притягивается другой электрон проводимости. Так, благодаря поляризации положительных зарядов, между электронами возникает сила притяжения. Этот процесс в какой-то мере подобен процессу обменного взаимодействия, благодаря которому возникает ковалентная связь между атомами. Оценки показывают, что сила притяжения между электронами превышает силу отталкивания между ними. В результате в объеме ЭФГ возникает множество связанных в отдельные пары электронов, эти пары называются куперовскими парами (к. п.). У электронов к. п. векторы собственных моментов импульсов антипараллельны, поэтому полный момент импульса к. п. всегда равен нулю, спиновое квантовое число одной к. п. s = 0. Итак, каждая к. п. является бозоном, для них запрет Паули не выполняется, в частности, в одном и том же состоянии может находиться множество к. п. Оценим расстояние между соседними к. п. Пусть первоначально температура металла Т = 0 К. В металле электрическое поле отсутствует, и электрический ток не протекает. В этом случае все состояния ниже уровня Ферми оказываются заполненными электронами (см. раздел 3.5), а все состояния с энергией выше уровня Ферми будут полностью свободными. Если вещество изотропное, то поверхность Ферми (см. раздел 3.5) в пространстве импульсов будет иметь сферическую форму с радиусом сферы рФ. Пусть теперь температура металла выше 0 К, но меньше Тк. Тогда некоторые электроны, первоначально находившиеся вблизи поверхности Ферми, перейдут на более высокие свободные уровни энергии, расположенные в непосредственной близости к поверхности Ферми. В результате вблизи поверхности Ферми возникает тонкий слой энергетических состояний, частично заполненный электронами. Толщина этого слоя находится в интервале импульсов от р01 = рФ - ∆p/2 до р02 = рФ + ∆p/2, а интервал энергий электронов в пределах этого слоя при температуре, близкой к Тк, будет ∆ε ≈ k Tк << ε , где ε – средняя кинетическая энергия валентного электрона металла. Пусть два электрона проводимости участвуют в образовании к. п. В отсутствие тока импульсы электронов к. п. равны по величине и противоположны по направлению. Интервал энергий электронов в пределах сферического слоя вблизи поверхности Ферми отличается от энергии Ферми εФ на величину kTк:
148 2 p 2 pФ p + pФ − ≈ Ф ∆p, (3.6.1) 2m 2m 2m где р = рФ + ∆p ≈ р, ∆р – толщина сферического слоя в пространстве импульсов вблизи поверхности Ферми, ∆р << рФ. Из (3.6.1) имеем p kTк = Ф ∆p . (3.6.2) m Оценим величину области, в которой локализованы электроны к. п., для чего воспользуемся соотношением неопределенности и соотношением (3.6.2):
kTк ≈
η η pФ = (3.6.3) ∆ p m kTк Вычисление по формуле (3.6.3) проведем для Т=5 К и рФ= ∆x≈
=1,2·10-24 кг ⋅ м . В результате получаем, что область локализации к. п. с
равна порядка 10-7 м, а среднее расстояние между электронами проводимости в ЭФГ порядка 10-10 м. Следовательно, между электронами в к. п. может находиться значительное число электронов проводимости, хотя и не каждый из них может участвовать в образовании к. п. При разрыве к. п. возникают два электрона проводимости в состояниях, отделенных друг от друга энергетическим интервалом, причем в нем отсутствуют квантовые состояния (уровни полных энергий). Если теперь Т < Тк, то образовавшиеся из к. п. электроны из-за недостаточной энергии не могут преодолеть возникший потенциальный барьер и перейти в возбужденное состояние на более высокий уровень полной энергии. В результате такие освободившиеся электроны вновь вступают в куперовское взаимодействие с другими электронами ЭФГ и создают новые к. п. Ясно, что такой процесс не может привести к возникновению новых состояний в составе Бозе-газа, Бозе-газ попрежнему ведет себя как единое целое. Если же Т > Тк, то электроны, образовавшиеся при разрыве куперовской связи, обладают энергией, достаточной для преодоления энергетической щели, Бозе-газ постепенно исчезает. Пусть первоначально при Т = Тк электрическое поле отсутствует, поэтому импульс к. п. равен нулю. Затем создадим в образце электрическое поле напряρ женностью E . Тогда в этом поле каждый электрон к. п. получит один ρ и тот же дополнительный импульс ∆p , а полные импульсы электроρ ρ ρ ρ ρ ρ нов к.п. будут p1 = p11 + ∆p , p2 = p12 − ∆p . Следовательно, к. п. по-
149
ρ лучит общий дополнительный импульс 2∆p . В результате Бозе-газ
начнет перемещаться с определенной скоростью, величина которой определяется величиной импульса ∆p 2∆p = 2m v , v = . m В результате в образце возникает электрический ток I плотностью j: j = 2e nv,
(3.5.4)
где n – концентрация, v – дрейфовая скорость к. п. Возникший ток сверхпроводимости в проводнике создает электриρ ческое поле самоиндукции Ec , постепенно ослабляющее в проводнике ρ поле E , и в стационарном случае результирующее электрическое поле исчезает, после чего к. п. в проводнике перемещаются с постоянной скоростью v, создавая при этом ток сверхпроводимости, который, в свою очередь, создает вне сверхпроводника постоянное магнитное ρ поле. В результате совместного действия поля E и электрического ρ поля самоиндукции Ec , ток сверхпроводимости протекает только в тонком слое (10–100 нм) вблизи поверхности сверхпроводника. К. п. относятся к бозонам, принцип Паули к ним не применим. Поэтому число Бозе-частиц, находящихся в одном состоянии, не ограничено. При сверхнизких температурах бозоны скапливаются в основном состоянии, из которого их довольно трудно перевести в возбужденное состояние. Система Бозе-частиц, или что то же самое, система к. п., обладая устойчивостью к возможности отрыва электрона, под ρ первоначальным действием электрического поля E , а затем и в его отсутствие может перемещаться, не встречая сопротивления в сверхпроводнике. Это означает, что ток сверхпроводимости протекает в отсутствии электрического сопротивления. При критической плотности тока jк ≈ 1012 А/м2 в таком проводнике может протекать ток порядка 100 А. Попытаемся понять физическую причину отсутствия электрического сопротивления, используя метод аналогии. Газ, состоящий из к. п., представляет собой бозонный газ; особенностью такого газа является то, что частицы, входящие в его состав, т. е. отдельные к. п., не взаимодействуют между собой и движутся в металле с постоянной скоростью, т.е. движутся в веществе без трения. В обычном Бозе-газе существует статистическое распределение частиц по энергиям. Что же касается к. п., то все они находятся в од-
150
ном и том же квантовом состоянии и описываются одной волновой функцией, в которой от числа частиц зависит только ее амплитуда. Поэтому скорость к. п. постоянна. Нечто подобное имеет место и в оптике. Нам известно, что кванты электромагнитной волны, фотоны, являются бозонами. Излучение электромагнитных волн с корпускулярной точки зрения представляет собой поток фотонного газа, обладающего свойствами Бозе-газа. В веществе фотоны движутся с постоянной скоростью. При столкновении с атомами они испытывают либо упругое рассеяние, либо поглощаются. Таким образом, фотонный газ (Бозе-газ) состоит из двигающихся с постоянной скоростью частиц. Нечто подобное происходит и с Бозе-газом, состоящим из к. п. Как видим, материя едина в своих различных проявлениях. В дальнейшем при изучении сверхпроводящего состояния различных веществ было установлено, что в природе существуют сверхпроводники 1-го и 2-го рода. Теория сверхпроводников 1-го рода была создана в основном работами Дж. Бардина, Л. Купера и Дж. Шриффера, она применима к большинству чистых металлов, ее основы были изложены выше. Теория сверхпроводников 2-го рода была разработана советскими физиками А.А. Абрикосовым и Л. П. Горьковым в 1957–1959 гг. К сверхпроводникам 2-го рода относится большинство сплавов, а также многие чистые металлы с примесями. В этих материалах возникающие во внешнем магнитном поле сверхпроводящие токи текут не только по поверхности, но и в толще проводника. Было установлено, что в сверхпроводнике 2-го рода существуют микроскопические цилиндрические области с протекающими в них вихревыми электрическими токами. В цилиндрических областях к. п. отсутствуют, следовательно, там отсутствует и сверхпроводимость. За пределами этих областей вещество обладает сверхпроводимостью. Итак, хотя через сверхпроводник 2-го рода магнитное поле и проникает, он все же сохраняет сверхпроводящие свойства благодаря наличию у него сверхпроводящих промежутков. С ростом магнитного поля число цилиндрических областей увеличивается, сверхпроводящие промежутки между ними уменьшаются, сверхпроводящий электрический ток также уменьшается. В конечном итоге в больших магнитных полях сверхпроводимость исчезает. В настоящее время получены сверхпроводники 2-го рода с критическим магнитным полем более 20 Тл, в то время как у сверхпроводников 1-го рода оно не превышает 0,1 Тл . Сверхпроводниковые сплавы благодаря высокому критическому значению индукции магнитного поля Вк нашли широкое применение при изготовлении обмоток соле-
151
ноидов, предназначенных для получения сверхсильных магнитных полей. После того как ученые установили физическую причину сверхпроводимости, во многих странах мира начались интенсивные исследования с целью создания высокотемпературных сверхпроводников. К настоящему времени работы ведутся в основном со сверхпроводниками 2-го рода. Так, в 1999 г. в литературе появилась публикация о синтезе под высоким давлением сверхпроводника Ba-Ca-Cu-O с критической температурой 126 К. Как оказалось, если этот сверхпроводник поместить на воздух при атмосферном давлении, то переход в сверхпроводящую фазу происходит при Тк = 90 К. Результаты этой и других работ, в которых критическая температура оказалась равной 70 К, показывают, что сверхпроводимость может быть достигнута уже при температуре жидкого азота, что делает практическое использование сверхпроводников более простым и дешевым. В табл. 3.1 и 3.2 приводятся некоторые характеристики чистых металлов и соединений в сверхпроводящем состоянии. Элемент
Tк , К
Bк , Тл
ξ0 , нм
λ , нм
Al
1,18
0,01
1500
35
Nb
9,3
0,20
38
39
Pb
7,2
0,08
70
50
Таблица 3.1. Характеристики чистых металлов в сверхпроводящем состоянии: ξ0 – размер к. п.; λ – глубина проникновения внешнего магнитного поля в образец Соединение
Tк , K
Nb3 Ge
6,9 (в плёнке 23,2)
V3 Ga
14,6–16,8
V3 Si
17,1
Ta3 Bp
17,0
Таблица 3.2. Характеристики соединений в сверхпроводящем состоянии
152
3.7. Свободные электроны в кристаллической решетке твердого тела Любое твердое тело состоит из атомов. Если атомы в твердом теле располагаются периодически, то такое тело называется кристаллическим. Если же этого не имеет места, то оно называется аморфным. Таким образом, у кристаллических тел наблюдается дальний порядок расположения атомов, у аморфных он отсутствует. В настоящее время микроскопическая теория кристаллического состояния в общих чертах разработана достаточно хорошо, микроскопическая теория аморфного состояния находится в стадии развития, и ее результаты все еще недостаточны, чтобы их можно было бы излагать в курсе общей физики. Любое кристаллическое твердое тело состоит из огромного числа периодически расположенных в пространстве атомов. Для описания их совместного движения необходимо составить число уравнений, равное полному числу частиц, входящих в состав твердого тела. Но в такой постановке задача оказывается невыполнимой. Поэтому для описания движения системы частиц используются многочисленные соответствующие опыту упрощающие предположения. Рассмотрим эту задачу, применяя для ее решения методы квантовой механики. В общем виде уравнение Шредингера для системы частиц, входящих в состав кристаллической решетки твердого тела, имеет вид ρ ρ ρ ρ Hˆ ψ (r , R) = ε ψ(r , R) , (3.7.1) где ε = εe + ε я . (3.7.2) В (3.7.1) Hˆ – оператор Гамильтона всех частиц твердого тела, ρ ρ ψ(r , R) – волновая функция всей системы частиц, состоящей из элекρ ρ тронов и ядер, r , R – соответственно координаты электронов и ядер, εe , εя – соответственно полная энергия всех электронов и ядер. Уравнение (3.7.1) в общем виде в принципе решить невозможно. Поэтому для дальнейшего анализа используют различные приближения. 7.1. Адиабатическое приближение Из опыта известно, что масса электрона всегда значительно меньше массы ядра любого атома. Поэтому при одной и той же кинетической энергии скорость электрона многократно больше скорости ядра. Следовательно, при рассмотрении этой системы частиц можно кон-
153
статировать, что по сравнению с электронами ядра атомов можно принять за неподвижные или перемещающимися с очень малыми скоростями. Это позволяет считать движение электронов и ядер независимыми. В теории вероятностей имеется теорема: вероятность двух независимых событий равна произведению вероятностей каждого из них. Поэтому плотность вероятности такого сложного события равна произведению плотностей вероятности каждого из них: ρ ρ ρ ρ ψ 2 (r , R) = ψ 2 (r ) ψ 2 ( R) . (3.7.3) Тогда результирующая волновая функция будет равна произведению исходных волновых функций: ρ ρ ρ ρ ψ (r , R) = ψ( r ) ψ( R) = ψ e ψ я . (3.7.4) Так как энергия – аддитивная величина, то оператор Гамильтона также аддитивен: (3.7.5) Hˆ = Hˆ e + Hˆ я . Подставим значения из (3.7.2)–(3.7.5) в уравнение (3.7.1) и разделим переменные: Hˆ e ψ e Hˆ я ψ я Hˆ e + Hˆ я ψ e ψ я = (ε e + ε я ) ψ e ψ я ; + = εe + ε я ; ψe ψя Hˆ e ψ e Hˆ ψ − ε e = ε я − я я = 0 ; Hˆ e ψ e = ε e ψ e ; Hˆ я ψ я = ε я ψ я . ψe ψя Теперь уравнение Шредингера (3.7.1) распалось на два независимых уравнения: одно – для электронов, другое – для ядер. Однако и эти уравнения все еще оказываются слишком сложными для их решения. Поэтому используется следующее приближение.
(
)
7.2. Приближение самосогласованного поля В этом приближении используются следующие допущения. 1. В процессе образования кристаллической решетки валентный электрон отрывается от своего атома. 2. Все электроны, кроме валентных, вместе с положительно заряженными ядрами создают в кристалле результирующее электрическое поле, в котором происходит движение валентных электронов. А так как ядра атомов твердого тела расположены в пространстве периодически, то движение валентных электронов происходит в периодическом поле кристаллической решетки. 3. Валентные электроны не взаимодействуют между собой, поэтому они образуют ЭФГ. С учетом принятых допущений потенциальная
154
энергия валентного электрона в электрическом поле кристаллической решетки (псевдопотенциал валентного электрона) ρ ρρ ρ V (r , R) = U(R) +Uc (r ) , (3.7.7) ρ где U (R ) – потенциальная энергия валентного электрона в электричеρ ском поле ядер; U c (r ) – потенциальная энергия валентного электрона в электрическом поле всех остальных электронов, кроме валентного, т.е. потенциальная энергия самосогласованного поля. Применив такой подход, можно многочастичную задачу свести к одночастичной, для которой уравнение Шредингера имеет вид: ρ ρ 2m (3.7.8) ∆ψ + 2e ε − V (r , R) ψ = 0 . η Введение самосогласованного поля позволяет все валентные электроны твердого тела рассматривать как систему невзаимодействующих частиц, т.е. как ЭФГ. Но и в этом случае задача все еще оказывается достаточно сложной. Поэтому вводятся два приближения, относящиеся к двум предельным случаям: приближение почти свободных электронов и приближение сильной связи.
(
)
7.3. Приближение почти свободных электронов ρ ρ В этом приближении псевдопотенциал V (r , R) записывают в следующем виде: ρ ρ ρ V (r , R) = V0 + V1 ( R) , (3.7.9) ρ ρ где V0=const, V1 ( R) – периодическая функция, V1 ( R) << V0 ; ρ ρ ρ ρ V1 ( R ) = V1 ( R + a ) , a – вектор трансляции, вектор переноса координаты от одного узла кристаллической решетки к ближайшему узлу решетки в прямом направлении. ε V
0
εФ V0 Рис. 3.7.1. Зона разрешенных энергий
x
155
ρ ρ Тогда ε − V (r , R) ≈ ε − V0 . На рис. 3.7.1 в качестве примера изображена зона разрешенных значений полных энергий свободных электронов в виде потенциальной ямы с плоским дном. При Т = 0 К в интервале энергий Vo ≤ ε ≤ εФ все уровни полностью заполнены электронами, а в интервале энергий εФ < ε ≤ 0 все уровни свободны. При Т > 0 К эти уровни заполняются в соответствии с распределением Ферми-Дирака. Указанное приближение хорошо выполняется для металлов. 7.4. Приближение сильной связи
ρ ρ В этом приближении предполагается, что U c (r ) << U ( R) , и поэтому ρ ρ ρ в соответствии с (3.7.7) имеем: V (r , R) ≈ U ( R) . Кроме того ρ ε = ε a + ε( k ) , (3.7.10) ε a – собственное значение полной энергии электрона в изолированном ρ атоме, ε (k ) – дополнительная энергия электрона, возникающая в ρ ρ ρ электрическом поле кристаллической решетки, k = k (r ) –- волновой вектор, k = 2π / λ , λ – длина волны де Бройля. Анализ показывает, что решение уравнения Шредингера возможно лишь для определенных значений полных энергий электрона, значит существуют разрешенные и запрещенные значения полной собственной энергии. В отсутствии внешних полей составляющая полной энергии электрона при движении в направлении координатной оси 0Х p2 η2 2 kx . ε0 = x = (3.7.11) 2me 2me Наличие внешних воздействий делают зависимость (3.7.11) более сложной, и ее в общем виде можно записать лишь функционально. На рис. 3.7.2 изображены графики полной энергии свободного электрона в отсутствии внешних воздействий (пунктирная линия) и с учетом действия электрического поля кристаллической решетки (сплошные линии). Если графики спроектировать на плоскость ε – y, то получим зоны разрешенных значений энергии, разделенные зонами запрещенных значений энергии. Интервал значений проекций волновых векторов на ось 0X 2π 2π − ≤ kx ≤ d d называется первой зоной Бриллюэна, интервалы значений
156
2π 2π 2π 2π ≤ kx ≤ − и ≤ kx ≤ 2 d d d d называется 2-ой зоной Бриллюэна и т.д., d – постоянная кристаллической решетки. −2
ε
ε
ε0
kx −2
2π d
−
2π d
0
2π d
2
2π d
y
Рис. 3.7.2. Зависимость энергии электрона от волнового числа Из рис. 3.7.2 видно, что ширина зон разрешенных значений энергий возрастает с ростом порядкового номера зоны Бриллюэна. Поэтому ширина каждой верхней зоны всегда больше соседней нижней зоны. 3.8. Зонная теория твердых тел
Из квантово-механической теории твердого состояния следует, что как в приближении почти свободных электронов (слабая связь валентного электрона с кристаллической решеткой), так и в приближении сильной связи у твердого тела возникают зоны разрешенных значений энергии, разделенные зонами запрещенных энергий. Рассмотрим более подробно физическую причину возникновения энергетических зон. Среди металлов наиболее простое объяснение высокой электропроводности на основе зонной теории можно дать металлическому Li. Атом Li содержит 3 электрона в состояниях 1s2 2s1 . Если расстояние между соседними атомами превышает 0,35 нм, то на таких расстояниях атомы взаимодействуют очень слабо, в пространстве их электроны разделены потенциальными барьерами. В состоянии 1s находятся два электрона, в состоянии 2s – один электрон. В процессе кристаллизации расстояния между ближайшими атомами постепенно уменьшают-
157
ся до тех пор, пока они не окажутся равными постоянной кристаллической решетки (0,35 нм). На этих расстояниях электронные оболочки 2s соседних атомов перекрываются. Возникает зона разрешенных значений энергии 2s. В результате взаимодействий между электронами в зоне 2s возникает 2N уровней полных энергий: N – число атомов в кристаллической решетке, 2 – два направления собственного момента импульса электронов. Но так как число электронов в состоянии 2s равно N, то из всех уровней полной энергии заполненными окажутся лишь N/2. Что же касается электронов 1s, то их число равно 2N, и все уровни этого состояния окажутся заполненными полностью (рис. 3.8.1). Электроны 1s у соседних атомов разделены потенциальными барьерами весьма малой толщины. Причина возникновения потенциального барьера следующая. Электрон 1s находится в электрическом поле ядра и второго электрона 1s, т.е. в электрическом поле, создаваемом эффективным зарядом q* = 3e - 1e = 2e, где e – заряд электрона, 3e – заряд ядра. Электрическое поле заряда q* обладает сферической симметрией. Поэтому валентный электрон 1s находится в электрическом поле кулоновских сил и обладает потенциальной энергией в электрическом поле остова атома: ( Z − 2) e 2 (3.8.1) U =− . Li 4π ε 0 r Электроны 1s находятся в непрерывном движении и туннельным эффектом могут преодолевать потенциальный барьер между атомами. А так как согласно Паули в одном состоянии не могут находиться два и большее число электронов, то в зоне 1s возникает число уровней полной энергии, равное числу атомов в кристаллической решетке твердого тела. Электроны 2s согласно принципу Паули заполняют лишь половину зоны 2s. Тогда в зоне 2s имеется большое число свободных уровней полной энергии. Если теперь в таком кристалле существует электрическое поле, то в нем возникает направленное движение свободных электронов 2s – электрический ток. Такой кристалл является хорошим проводником, а в твердом состоянии – металлом. Наличие частично незаполненной электронами зоны разрешенных значений энергии является необходимым условием возникновения тока проводимости. Только в этом случае под действием существующего в твердом теле электрического поля свободные электроны могут участвовать в направленном движении, только тогда возникают физические условия, при которых под действием поля на расстоянии, рав-
158
ном средней длине свободного пробега, электрон приобретает дополнительную скорость направленного движения, дополнительную кинетическую энергию. d
∆x>d
+
ε
+
+
x
U
+ + + + + +
ε
U
x
0
0
x
x
2P
2S
2S 1S 1S
Рис. 3.8.1. Электрон в периодическом поле Теперь рассмотрим твердое тело, образованное атомами Mg, у которого распределение электронов по состояниям 1s2 2s2 2p6 3s2. У кристаллического Mg зона 3s заполнена полностью, зона 3p свободна. Однако зоны 3s и 3p частично перекрываются. Поэтому в зоне 3p всегда будет достаточное число уровней полной энергии, на которые под действием различных возбуждений могут переходить электроны с нижних уровней на верхние (рис. 3.8.2).
ε 0
d
2d
ε
∆x
0 3p 3s 2s
Рис. 3.8.2. Перекрытие энергетических зон
∆x=d
y
} }
} 3p 3s
2s
159
При наличии в твердом теле созданного внешним источником электрического поля эти электроны будут участвовать в образовании тока проводимости. Значит, кристаллический Mg должен обладать хорошей электропроводностью, должен быть хорошим проводником электрического тока. Теперь предположим, что валентная зона заполнена полностью, но не перекрывает расположенную выше зону проводимости. Тогда величина электропроводности твердого тела зависит от ширины запрещенной зоны ∆ε. Если ∆ε < 1эВ, то в результате столкновений с фононами кристаллической решетки значительное число электронов валентной зоны приобретают дополнительную энергию и переходят в зону проводимости (рис. 3.8.3). К таким веществам, в частности, относятся Si и Ge. Так, у Si электроны атома по состояниям распределены следующим образом: 1s2, 2s2, 2p6, 3s2, 3p2. Валентными электронами являются электроны 3s и 3p.
ε
y
0
0 3p
{
ε
d
∆x
2d
3p
-
∆ε 3s
{
3s
Рис. 3.8.3. Образование зоны проводимости При комнатной температуре в результате столкновений с фононами кристаллической решетки некоторые из валентных электронов получают тепловое возбуждение, достаточное для перехода из валентной зоны в зону проводимости. В результате в зоне проводимости будет находиться значительное число электронов, которые под действием внешнего электрического поля будут перемещаться, создавая ток проводимости. Такой кристалл называется собственным полупроводником. В отличие от металлов, у собственных полупроводников с ростом температуры растет число электронов в зоне проводимости и уменьшается электрическое сопротивление. Но при Т = 0 К в зоне
160
проводимости свободных электронов нет, и собственный полупроводник превращается в диэлектрик. На рис. 3.8.3 изображена эволюция графиков полной энергии собственного полупроводника с изменением расстояния между соседними атомами Si: видно, как по мере уменьшения расстояния между атомами уровни 3s и 3p постепенно расщепляются, чтобы на расстоянии ∆x = d превратиться в зону. На рис. 3.8.3 видно также, что в результате переходов некоторого числа электронов из валентной зоны 3s в зону проводимости 3p часть зоны проводимости заполняется электронами. Поскольку в зоне проводимости имеется множество свободных уровней, то под действием даже слабых возбуждений свободные электроны способны участвовать в токе проводимости. Но так как число свободные электронов в зоне проводимости на много порядков меньше числа свободных электронов у металлов, то и электрическое сопротивление собственного полупроводника будет значительно больше электрического сопротивления металла. Если же ∆ε > 1эВ, то энергии фононов теперь уже будет недостаточно, чтобы при столкновении с ними свободные электроны получили энергию достаточную для перехода из валентной зоны в зону проводимости. В результате свободные электроны в зоне проводимости практически отсутствуют, свободных носителей заряда в ней нет. Такие вещества электрический ток не проводят. Это диэлектрики. Наконец, может быть предельный случай, когда ∆ε ≈ 0 эВ. Это означает, что валентная зона и зона проводимости соприкасаются между собой, причем зона проводимости даже при Т = 0 К должна быть частично заполнена электронами (рис. 3.8.4).
ε
∆x =d
y
0
-
Рис. 3.8.4. Энергетические зоны висмута
}
6p
}
5d
} 6s
161
Примером может служить Bi, у которого внешние электроны находятся в состояниях: 5d10 6s2 6p3. При Т = 0 К зона 6s заполнена полностью, зона 6p заполнена частично. При Т > 0 К вследствие переходов электронов из зоны 6s зона 6p заполняется дополнительно. Так как зоны 6p и 6s соприкасаются (∆ε = 0 эВ ), то подобные переходы имеют место при любой температуре. Такое вещество обладает высокой электропроводностью, но его электрическое сопротивление с ростом температуры уменьшается в области высоких температур и увеличивается в области низких. Это связано с тем, что при высоких температурах в зону проводимости в значительном количестве поступают электроны из валентной зоны. Но так как при высокой температуре энергия фононов достаточно велика, следовательно, и возбуждения электронов валентной зоны при столкновении с фононами оказываются значительными, что позволяет электронам переходить в зоны проводимости с более глубоких слоев валентной зону. Такое вещество при высоких температурах ведет себя как полупроводник. Наоборот, при низких температурах поступление электронов из валентной зоны в зону проводимости невелико, влияние их на изменение концентрации свободных электронов зоны проводимости незначительно. Поэтому при низких температурах такое вещество ведет себя как металл. Твердые тела, обладающие металлическими и полупроводниковыми свойствами, называются полуметаллами. 3.9. Эффективная масса квазиэлектрона в твердом теле
Под действием приложенной разности потенциалов в проводнике возникает электрический ток, т.е. направленный поток электронов. С микроскопической точки зрения это означает, что под действием электрического поля в проводнике возникает направленное ускоренное движение электронов, в результате на расстоянии, равном средней длине свободного пробега, электрон приобретает добавочную энергию – энергию возбуждения. Наличие энергии возбуждения наглядно проявляется на примере автоэлектронной эмиссии, когда вблизи поверхности металла под действием внешнего поля возникает потенциальный барьер конечной толщины. Электроны проводимости с определенной, хотя и весьма малой, вероятностью могут преодолеть его туннельным эффектом и вылететь в вакуум. Но вылететь может не любой электрон, а только тот, который получил элементарное возбуждение ∆ε.
162
У полупроводников элементарные возбуждения электронов называются квазиэлектронами. Они наделяются скоростью, квазиимпульсом, энергией и эффективной массой. По определению, квазиимпульс равен ρ ρ p = ηk . (3.9.1) Тогда сила, действующая на квазиэлектрон, ρ ρ dpρ dk F= =η . (3.9.2) dt dt Энергия квазиэлектрона p2 η 2 (3.9.3) k , ε= = * 2 me 2 me* где m*e – эффективная масса квазиэлектрона. Скорость квазиэлектрона ρ η ρ v = * k. (3.9.4) me Тогда производная от полной энергии по волновому числу с учетом неравенства k dme* 2 >> * , me dk (3.9.5) dε η2 = k. dk me* Если квазиэлектрон находится в электрическом поле напряженноρ стью E , то на квазиэлектрон действует сила dv (3.9.6) F = e E = me* . dt Из совместного решения уравнений (3.8.4) и (3.8.5) получаем: 1 dε v= , (3.9.7) η dk 1 1 dv = (3.9.8) . * me η dk
На рис. 3.9.1 слева изображены графики полной энергии ε, скорости v, эффективной массы m*e квазиэлектрона, а справа изображена зона разрешенных значений энергии для первой зоны Бриллюэна. Из рис. 3.9.1 следует, что вблизи дна зоны эффективная масса m*e положительна, вблизи верхней части зоны эффективная масса отрицатель-
163
на, и где-то в средней части зоны эффективная масса испытывает разрыв непрерывности.
ε
ε
me* < 0 me* > 0
−
2π d
0 v
2π d
kx
0
y
kx
m e*
kx
Рис. 3.9.1. К определению эффективной массы электрона Подставив в (3.9.2) значение k из (3.9.4), получим dv , (3.9.9) F = me* dt где 1 1 d 2ε . = me* η2 dk 2 Следовательно, квазиэлектрон можно рассматривать как свободную частицу, движение которой в кристаллической решетке подчиняется 2-му закону Ньютона. Появление у квазиэлектрона эффективной массы вызвано влиянием периодического поля кристаллической решетки на движущийся в зоне проводимости валентный электрон.
164
Эффективная масса квазиэлектрона – это не обычная масса электрона, а всего лишь коэффициент пропорциональности между внешdv , определяющий составляющую направней силой F и ускорением dt ленного движения электрона на фоне его хаотического движения. Эффективная масса квазиэлектрона не определяет ни запаса энергии, ни гравитационные, ни инерционные свойства электрона. Больше того, в общем случае направление действия силы и ускорения в пространстве могут и не совпадать. Единственным оправданием введения такого понятия является привычность и простота законов классической механики, которые с введением указанного коэффициента можно достаточно просто использовать для анализа особенностей движения свободного электрона в периодическом поле кристаллической решетки при наличии в ней внешнего электрического поля, а также возможность ее экспериментального измерения. Кроме того, в целом ряде случаев величина измеряемой эффективной массы квазиэлектрона имеет тот же порядок величины, что и масса свободного электрона. Это показывает, что эффективная масса квазиэлектрона в какой-то мере отображает реальные инерционные свойства электрона. Проведенное рассмотрение справедливо лишь в приближении сильной свяρ зи. Опыт показывает, что в ряде случаев графики дисперсии ε(k ) для полупроводников действительно имеют вид параболических зависимостей. 3.10. Дырочная проводимость
Для простоты рассуждений предположим, что в твердом теле имеется всего две зоны разрешенных значений энергии. Одна полностью заполнена электронами, другая полностью свободна, их разделяет зона запрещенных энергий. Теперь удалим электрон с одного из верхних уровней нижней зоны, для этого сообщим ему энергию, достаточную для перехода в верхнюю зону. Тогда в верхней зоне будет находиться электрон, а в нижней зоне освободится уровень полной энергии. Возникший свободный уровень, возникшее вакантное место в пределах заполненной зоны называется дыркой. Электрон, попавший в верхнюю зону из нижней, под действием электрического поля будет перемещаться, при этом на расстоянии, равном средней длине свободного пробега, он будет постепенно накапливать дополнительную энергию, будет постепенно переходить на более высо-
165
кие уровни. В заполненной зоне существует свободный уровень полной энергии, там также возникает направленное движение электронов. Происходит процесс, аналогичный процессу перемещения электрона в верхней зоне, когда под действием поля электрон переходит с нижнего уровня на верхний свободный. В результате такого перехода в заполненной зоне освобождается нижележащий уровень полной энергии. Возникший вакантный уровень полной энергии наделяется свойством частицы – это квазичастица и называется дыркой. −
2π d
0
2π d
y
kx
mд* > 0 mд* < 0
εд
εд
v
kx mд*
kx
Рис. 3.10.1. К определению эффективной массы дырок По мере возбуждения электронов, сопровождающегося переходами на выше расположенные соседние уровни, дырка постепенно будет опускаться в нижнюю часть заполненной зоны. Минимальным значением энергии дырка будет обладать на верхней границе заполненной зоны. В геометрическом пространстве дырка перемещается в направлении, обратном направлению движения электрона. Следовательно, под действием внешнего электрического поля дырка будет перемещаться точно так же,
166
как перемещалась бы положительно заряженная частица под действием того же поля. Стало быть, дырка как бы обладает положительным зарядом, равным заряду электрона, и, так как она – квазичастица, то также обладает эффективной массой m*д. Минимальным значением полной энергии дырка обладает на верхней границе заполненной зоны, поэтому отсчет энергии для дырок идет сверху вниз от верхней границы заполненной зоны. На рис. 3.10.1 по аналогии с квазиэлектронами приведены графики полной энергии ε, скорости v и эффективной массы m*g дырок в первой зоне Бриллюэна, а также соответствующая заполненная зона разрешенных энергий. Из приведенных графиков видно, что в верхней части заполненной зоны эффективная масса дырки mд* положительна, в нижней части зоны она отрицательна. Если эти понятия применить к собственному полупроводнику, то окажется, что в зоне проводимости электрон обладает некоторой энергией возбуждения, т. е. там возникает квазиэлектрон, у которого минимум энергии находится на дне зоны проводимости и отсчет энергии ведется снизу вверх, а в валентной зоне – дырка, для нее энергия растет сверху вниз (рис. 3.10.2). Под действием электрического поля они перемещаются в противоположных направлениях: дырка в валентной зоне, электрон - в зоне проводимости.
ε
εe
ρ E 0= 0
0
ρ ρ E 0= − E 0 j
y
Зона проводимости
Зона проводимости ρ
-
∆ε +
Валентная зона
y
ve
∆ε
ρ vg
+
Валентная зона
Рис. 3.10.2. Электронно-дырочная пара Итак, в собственном полупроводнике сразу возникают две квазичастицы – квзиэлектрон и дырка. В нем по-прежнему структурной еди-
167
ницей материи является электрон, а структурными единицами движения являются квазиэлектроны и дырки, причем в геометрическом пространстве квазиэлектрон совпадает с электроном, что же касается дырок, то они с электроном пространственно разделены. Дырки прямого физического смысла не имеют. Тем не менее, на основе использования понятия дырок можно достаточно просто объяснить некоторые физические особенности полупроводников.Можно предложить такой наглядный образ дырки. При тепловом возбуждении одна из связей между соседними атомами разрывается, участвовавший в образовании связи электрон становится электроном проводимости. Затем в результате флуктуации тепловых колебаний ионов решетки связь разрывается в другой части кристалла, а освободившийся валентный электрон занимает место в предыдущей разорванной связи, и т.д. Каждая разорванная связь обладает положительным зарядом, энергией, эффективной массой. Если теперь в кристалле существует электрическое поле ρ E0 , то под действием поля электроны и дырки будут двигаться в противоположные стороны, возникает ток проводимости. 3.11. Электрохимический потенциал в собственных полупроводниках
Пусть система, состоящая из N частиц, характеризуется постоянной температурой и объемом (T, V) = const. Такую систему можно описать, используя различные макроскопические параметры, в данном случае используя изохорно-изотермный потенциал, или, что тоже самое, свободную энергию: F = U – T·S , (3.11.1) U – внутренняя энергия, S – энтропия системы частиц, Т – температура. По физическому смыслу свободная энергия является мерой той работы, которую может совершить система, находясь в изохорноизотермном состоянии при переходе системы из одного фазового состояния в другое. Тогда химическим потенциалом называется величина, равная изменению свободной энергии при изменении числа незаряженных частиц в системе на единицу в изохорно-изотермном процессе: ⎛ ∂F ⎞ (3.11.2) µ=⎜ ⎟ . ⎝ ∂N ⎠T ,V Если же в объеме находится система заряженных частиц, то свободная энергия системы заряженных частиц
168
Fq = F + N εn, (3.11.3) εn = qφ, εn – потенциальная энергия частицы с зарядом q, φ – потенциал электростатического поля, N – полное число частиц в системе. По определению электрохимический потенциал заряженной частицы ⎛ ∂Fq ⎞ ⎟⎟ , µ э = ⎜⎜ (3.11.4) ⎝ ∂N ⎠V ,T µ э = µ + qϕ . Разделим полный объем V на два вспомогательных объема V1 и V2. Тогда в объеме V1 будет находиться N1 частиц, а в объеме V2 будет находиться N2 частиц. Частицы движутся хаотически, поэтому между объемами V1 и V2 происходит обмен частицами, т.е. имеет место диффузионный контакт (рис. 3.11.1). Полное число частиц в объеме N = N1 + N2 = const. Следовательно, увеличение числа частиц в объеме V1 означает убыль их числа в объеме V2: dN1 = - dN2. В общем случае изменение свободной энергии dF = µ 1 dN1 + µ 2 dN 2 . Но в состоянии термодинамического равновесия dF = 0, поэтому µ1 dN1 = −µ 2 dN 2 . (3.11.5) После подстановки в (3.11.5) dN1 = - dN2 получаем (3.11.6) µ1 = µ 2 = µ . Итак, при термодинамическом равновесии химические потенциалы в различных частях системы частиц равны между собой.
V1
V2
N1
N2
µ э1
µэ2
Рис. 3.11.1. Термодинамическое равновесие Пусть теперь в объеме находятся N заряженных частиц. Тогда в общем случае dFq = µ dN + ε n dN .
169
Но при наличии термодинамического dFq= 0, dN1 = - dN2 , имеем µ э1 = µ э2 = µ э .
равновесия,
когда
(3.11.7)
Таким образом, при термодинамическом равновесии в различных частях пространства электрохимические потенциалы равны между собой. Эта особенность электрохимического потенциала позволяет использовать его для определения условия, при котором в системе имеет место термодинамическое равновесие. Неравенство между собой электрохимических потенциалов в различных микрообъемах указывает на протекание различных процессов переноса в пространстве. Определим теперь положение уровня электрохимического потенциала в собственном полупроводнике, в котором существует система квазиэлектронов и дырок. Направления отсчета энергии у них противоположные: у квазиэлектронов начало отсчета энергии – на дне зоны проводимости, у дырок – на верхней границе валентной зоны. Электрохимический потенциал – это энергетическая величина, определяющая состояние термодинамического равновесия в системе частиц или квазичестиц. Так как в собственном полупроводнике одновременно существуют квазиэлектроны и дырки, то электрохимический потенциал такой системы квазичастиц будет равен среднему значению его составляющих: µ эe + µ эд µэ = . (3.11.8) 2
εe
Зона проводимости
fe 0e 0д
fд
µ эe
µ э ∆ε
0
µ эд Валентная зона
εд Рис. 3.11.2. Зоны собственного полупроводника
170
На рис. 3.11.2 изображены расположение зон в собственном полупроводнике, где fe, fд – функции Ферми-Дирака для квазиэлектронов и дырок: −1
−1
⎛ ⎛ ε e − µ эe ⎞ ⎞ ⎛ ⎛ ε − µ эд ⎞ ⎞ ⎟ + 1⎟ , f д = ⎜ exp⎜ д ⎟ + 1⎟ . (3.11.9) f e = ⎜ exp⎜⎜ ⎟ ⎜ ⎟ ⎜ ⎜ kT ⎟ ⎟ kT ⎠ ⎠ ⎠ ⎠ ⎝ ⎝ ⎝ ⎝ Для вычислений функций распределения fe и fд необходимо знать электрохимический потенциал квазичастиц. Ранее в разделе 3.5 было получено выражение для химического потенциала свободного электрона: 2⎞ ⎛ ⎜ π 2 ⎛⎜ kT ⎞⎟ ⎟ µ = µ 0 ⎜1 − (3.11.10) ⎟, ⎜ 12 ⎜⎝ µ 0 ⎟⎠ ⎟ ⎝ ⎠ 2
h 2 ⎛ 3n ⎞3 µ0 = (3.11.11) ⎜ ⎟ . 8 m* ⎝ π ⎠ Формулы (3.11.10) и (3.11.11) полностью применимы для квазиэлектронов и дырок. Из опыта известно, что концентрация квазиэлектронов в металле примерно в 106 раз больше концентрации квазичастиц в собственных полупроводниках. Как видно из формулы (3.11.10), для вычисления химического потенциала необходимо знать эффективную массу квазичастиц. В табл. 3.11.1 приводятся относительные значения эффективных масс квазиэлектронов и дырок в Si и Ge, а также ширина запрещенной зоны ∆ε0 у каждого из этих полупроводников.
me* me
mд* me
∆ε 0 , ЭВ
Si
1,08
0,37
1,12
Ge
0,56
0,59
0,66
Табл. 3.11.1. Относительные значения эффективных масс квазиэлектронов, m*e, и дырок, m*д, и ширина запрещенной зоны, ∆ε0 в Si и Ge Подставив найденные значения в (3.11.10), (3.11.11), получим: µ эe ≈ 0 , µ эд ≈ 0 .
171
Это означает, что функции Ферми-Дирака fe и fg для квазичастиц соответственно локализованы вблизи границ зоны проводимости и валентной зоны. Из рис. 3.11.2 видно, что µ эд = µ эe − ∆ε 0 . (3.11.12) Подставим µ эд из (3.11.12) в (3.11.8): ∆ε 0 µэ =− . (3.11.13) 2 Итак, уровень электрохимического потенциала в собственном полупроводнике для системы, состоящей из квазиэлектронов и дырок, проходит через середину запрещенной зоны (рис. 3.11.2). Более строгий анализ показывает, что положение уровня электрохимического потенциала незначительно меняется с изменением температуры. Это связано с тем, что зависимость для квазиэлектронов более сильная, чем аналогичная зависимость для дырок. 3.12. Примесные полупроводники
Электропроводность собственных полупроводников очень сильно зависит от концентрации примесей, введенных в кристаллическую решетку. Так, введение в Si всего лишь 0,001% бора увеличивает электропроводность в 1000 раз. Повышенная электропроводность, обусловленная примесями, называется примесной проводимостью, а сами полупроводники – примесными полупроводниками. Для выяснения механизма действия примесей на проводимость полупроводников рассмотрим влияние фосфора P и бора В на свойства Si. Чистый Si является собственным полупроводником. Атом Si имеет порядковый номер в периодической системе элементов Z = 14, поэтому в состав его электронной оболочки должно входить 14 электронов, распределенные по состояниям следующим образом: 1s2 2s2 2p6 3s2 3p2 . Такая система электронов позволяет Si иметь кристаллическую решетку, в которой каждый атом окружен четырьмя ближайшими соседями. Связь между ними ковалентная и создается электронами 3s3p. На рис. 3.12.1 изображена плоская модель кристаллической решетки. Предположим, что некоторое число атомов Si заменена атомами фосфора Р, у которого Z=15, а электроны распределены по состояниям 1s2 2s2 2p6 3s2 3p3. Значит, атом Р имеет валентность, равную 5, она определяется электронами 3s2 3p3. Внедренный атом Р для образова-
172
ния связи с четырьмя ближайшими атомами использует 4 валентных электрона, пятый валентный электрон в образовании связи не участвует, он первоначально движется вокруг атома P (рис. 3.12.1), постепенно удаляясь от него. Тепловые столкновения с электронами и фононами кристаллической решетки приводят к тому, что электрон переходит в возбужденное состояние, а расстояние между электроном и остовом атома P увеличивается настолько, что между ними находится один или несколько атомов Si. Эти атомы экранируют электрическое поле остова атома P, в результате связь между электроном и остовом ослабляется настолько, что достаточно тепловых столкновений ионов Si с электроном, чтобы он оторвался от своего атома и превратился в электрон проводимости.
p+
Рис. 3.12.1. Кристаллическая решетка кремния с примесью Указанный наглядный процесс означает, что внедренный атом примеси создает в запрещенной зоне уровень полной энергии, на котором первоначально находится валентный электрон атома Р. Этот уровень располагается вблизи дна зоны проводимости на расстоянии ∆ε дон = 0, 044 эВ и называется донорным уровнем, так как он является основным поставщиком электронов в зону проводимости (заполненный электроном уровень-донор). Действительно, в результате возбуждения атома Р тепловыми колебаниями решетки валентный электрон 3р отрывается от атома и переходит с донорного уровня в зону проводимости (рис. 3.12.2), при этом атом Р превращается в положительно заряженный ион, прочно связанный с ближайшими ионами кристаллической решетки. Положительный заряд иона под действием электрического поля в
173
образовании тока проводимости участвовать не может, в образовании тока проводимости будут участвовать электроны, перешедшие в зону проводимости как с примесных уровней, так и из валентной зоны. Ширина запрещенной зоны у Si ∆ε0 =1,12эВ.
ε
Зона проводимости
∆ ε дон
-
{
-
∆ε +
+
0
µ эn
Валентная зона
Рис. 3.12.2. Примесная электронная проводимость Итак, концентрация электронов в зоне проводимости в основном определяется концентрацией атомов примеси. Возникшие же в результате переходов в валентной зоне дырки имеют концентрацию на много порядков меньше, чем концентрация электронов в зоне проводимости, и практически не влияют на величину электропроводности при комнатной температуры. Такой полупроводник обладает электронной проводимостью и называется полупроводником n-типа, в нем основными носителями заряда являются электроны, а неосновными носителями заряда являются дырки. Предположим теперь, что в кристаллической решетке Si некоторое число атомов замещено атомами бора В, у которого электроны по состояниям распределены следующим образом: 1s2 2s2 2p1. Валентным электроном является электрон в состоянии 2p. Для образования связей с четырьмя ближайшими соседними атомами Si атому В не хватает одного электрона. Его можно заимствовать у атома Si. Опыт показывает, что для отрыва валентного электрона 2р от атома Si требуется энергия активации ∆ε акц = 0,046эВ, которая может быть получена от фононов кристаллической решетки. Разорванная в кристаллической решетке связь обладает свойством положительного заряда, равного заряду электрона, она не локализована возле какого-либо конкретного атома Si, а вследствие флук-
174
туаций колебаний ионов кристаллической решетки случайным образом перемещается от одного атома к другому (рис. 3.12.3).
B
Рис. 3.12.3. Дырочная примесь
ε Зона проводимости -
∆ε
0
µ эp
-
∆ ε акц { +
+
Валентная зона
Рис. 3.12.4. Примесная дырочная проводимость Внедрение в кристаллическую решетку атомов В означает, что в непосредственной близости к верхней границе валентной зоны возник примесный свободный уровень (рис. 3.12.4). Близость этого уровня к заполненной валентной зоне приводит к тому, что уже при сравнительно низких температурах электроны из валентной зоны переходят на примесный уровень. Кроме того, наряду с переходами на примесные уровни, в результате возбуждений некоторое число электронов переходит из валентной зоны в зону проводимости, но их концентра-
175
ция там чрезвычайно мала. Возникшая в валентной зоне разорванная между соседними атомами Si связь обладает свойством квазичастицы и называется дыркой. Дырка имеет положительный заряд, эффективную массу, энергию. Но так как концентрация дырок в валентной зоне во много раз больше концентрации квазиэлектронов в зоне проводимости, то основными носителями заряда в таких полупроводниках являются дырки, не основными – квазиэлектроны. Такие полупроводники называются полупроводниками р-типа. Таким образом, в кристаллическом Si все трехвалентные атомы примеси создают дырочный, а все пятивалентные атомы примеси – электронный тип проводимости. В отличие от собственной проводимости, которая имеет место в собственном полупроводнике и осуществляется одновременно квазиэлектронами и дырками, примесная проводимость полупроводника обусловлена в основном носителями заряда одного знака: квазиэлектронами в случае донорной примеси, дырками – в случае акцепторной примеси; эти носители заряда называются основными. Кроме них, примесный полупроводник содержит и неосновные носители заряда: полупроводник n-типа – дырки, полупроводник р-типа – квазиэлектроны. Концентрация их, как правило, значительно меньше концентрации основных носителей заряда. Поэтому доля, вносимая ими в электропроводность, во много раз меньше доли, вносимой основными носителями заряда. 3.13. Электропроводность полупроводников
Электропроводность вещества – это одна из тех немногих характеристик твердого тела, которую сравнительно легко можно определить из опыта, например, непосредственным измерением электрического сопротивления. Для оценки величины электропроводности любого тела используются такие физические величины, как электрическое сопротивление, удельное электрическое сопротивление, удельная электропроводность. Если полупроводник однородный и имеет по длине постоянное поперечное сечение, то электрическое сопротивление образца вычисляется по формуле: λ R=ρ , (3.13.1) S где ρ = σ-1 – удельное сопротивление, σ – удельная электропроводность.
176
3.13.1. Собственный полупроводник Пусть в собственном полупроводнике существует электрическое поле напряженностью Е0, под действием которого в нем возникает направленное движение свободных зарядов – электрический ток. Опыт показывает, что при малых напряженностях электрического поля средняя скорость направленного движения носителей заряда пропорциональна напряженности электрического поля: v = b E0 , (3.13.2) где b – подвижность, – средняя скорость носителя заряда. Уравнение (3.13.2) позволяет сформулировать следующее определение подвижности носителей заряда: подвижностью носителей заряда называется величина, численно равная средней скорости направленного движения, которую носители заряда того или иного знака приобретают в электрическом поле напряженностью 1В/м. Из раздела "Электричество" известно, что плотность электрического тока j = en v , (3.13.3) где n – концентрация носителей заряда, e – заряд электрона, e<0. Отсюда после подстановки значения из (3.13.2) в (3.13.3) получаем: (3.13.4) j = e n b E0 . Но, поскольку в собственном полупроводнике находятся носители заряда двух знаков, то результирующая плотность тока будет зависеть от концентрации квазиэлектронов ne и дырок nд. В собственном полупроводнике всегда ne = nд. Что же касается подвижностей квазиэлектронов и дырок, то они в общем случае не равны между собой, поскольку эффективные массы квазиэлектронов и дырок различны по величине. Тогда результирующая плотность тока (3.13.5) j = je + j g = e ne (be + bд )E0 Запишем закон Ома в дифференциальной форме: j = σ E0 . (3.13.6) Из уравнений (3.13.5) и (3.13.6) находим удельную электропроводность: σ = e ne be + bq . (3.13.7)
(
)
Найдем теперь температурную зависимость удельной электропроводности. Ранее было получено выражение для концентрации свободных электронов в интервале энергий от ε до ε + dε :
177 3 4π (2m*) 2
1 ε2
dε (3.13.8) . ⎛ ε − µэ ⎞⎞ 3⎛ h ⎜⎜1 + exp ⎜ ⎟ ⎟⎟ ⎝ kT ⎠ ⎠ ⎝ Применим его как для квазиэлектронов зоны проводимости, так и для дырок валентной зоны, приняв всюду эффективную массу постоянной величиной. Тогда dn =
3 * 2 4π (2me )
1 ε2
dε (3.13.9) . ⎛ ε − µэ ⎞⎞ 3⎛ h ⎜⎜1 + exp ⎜ ⎟ ⎟⎟ ⎝ kT ⎠ ⎠ ⎝ Так как концентрация квазиэлектронов достаточно мала, то для них распределение Ферми-Дирака совпадает с распределением МаксвеллаБольцмана: dne =
−1
ε−µ э
− ⎛ ⎛ ε − µэ ⎞⎞ fФ = ⎜⎜1 + exp ⎜ (3.13.10) ⎟ ⎟⎟ ≈ e kT . ⎝ kT ⎠ ⎠ ⎝ Тогда с учетом (3.13.10) уравнение (3.13.9) можно записать в следующем виде:
ne =
3 * 2 4π (2me ) 3
h
µэ ∞ 1 ε − kT kT 2 ε e e
∫ 0
3
µ
⎛ 2π me*kT ⎞ 2 э ⎟ e kT . (3.13.11) dε = ⎜ ⎜ h2 ⎟ ⎝ ⎠
Так как µэ = −
∆ε 0 , 2
то ∆ε
⎛ 2π me*kT ⎞ − 0 ⎟ e 2 kT . ne = ⎜ ⎜ h2 ⎟ ⎠ ⎝
(3.13.12)
Если подставить найденное выражение (3.13.12) для ne в формулу (3.13.7), то получим выражение для удельной электропроводности собственного полупроводника в виде 3
∆ε
− 0 ⎛ 2π me*kT ⎞ 2 ⎟ be + bg e 2 kT . σ = e⎜ (3.13.13) ⎜ h2 ⎟ ⎝ ⎠ Величины подвижностей квазиэлектронов и дырок с изменением температуры меняются незначительно по сравнению с экспоненци-
(
)
178
альным множителем. Тогда с учетом этого приближения можем записать: −
∆ ε0
σ = σ0 e 2 kT . (3.13.14) Отсюда температурная зависимость удельного электрического сопротивления ∆ ε0 e 2 kT .
ρ = ρ0 (3.13.15) Формулы (3.13.14) и (3.13.15) позволяют по известной экспериментальной зависимости вычислить энергию активации, т.е. ширину запрещенной зоны ∆ε0. 13.2. Примесные полупроводники Первоначально рассмотрим особенности электропроводности у полупроводников n-типа. У них концентрация носителей заряда определяется концентрацией носителей в собственном полупроводнике и концентрацией примесей, соответственно так же определяется и плотность тока:
n = nc + nn , j = jc + jn ,
(3.13.16)
где nc, nn, – концентрации носителей заряда собственного полупроводника и атомов примеси, соответственно; j – плотность тока проводимости, созданная квазиэлектронами и дырками соответственно в зонах проводимости и валентной. jc = σ c E0 , jn = σ n E0 , (3.13.17) σ c = e ne (be + bg ) , σ n = e nn be ; j = σ E0 , σ = σ c + σ n . (3.13.18) Проведя рассуждения, аналогичные разделу 3.13.1, получим: −
∆ ε0
−
∆ ε дон
σ = σ0c e 2kT + σ0n e 2kT . (3.13.19) Если же полупроводник р-типа, то на основании предыдущего можем записать σ = σ 0c e
−
∆ ε0 2 kT
+ σ0 p e
−
∆ ε акц 2 kT
.
(3.13.20)
Но поскольку ∆ε0 >> ∆εдон , ∆ε0 >> ∆εакц , то при достаточно низкой температуре электропроводность примесных полупроводников в основном определяется величиной концентрации примесей. Однако с ростом температуры примесные уровни будут постепенно истощаться,
179
и при высоких температурах электропроводность будет определяться концентрацией носителей заряда в собственном полупроводнике. Формулы (3.13.19), (3.13.20) позволяют по результатам опыта вычислить энергию активации в полупроводниках n- и р-типа при комнатной температуре или близкой к ней. В этом случае ∆ε0>>∆εдон, ∆ε0 >> ∆εакц. Тогда в уравнениях (3.13.19), (3.13.20) первыми слагаемыми можно пренебречь, записав σn = σn0 e
−
∆ ε дон 2 kT
, σ p = σ p0 e
−
∆ ε акц 2 kT
.
(3.13.21)
3.14. Контакт двух полупроводников
Рассмотрим контакт n- и р-полупроводников, причем для простоты дальнейших рассуждений предположим, что у этих полупроводников собственный полупроводник один и тот же. Опыт показывает, что при введении в контакт таких полупроводников в области контакта возникает особый слой, получивший название p-n перехода. p-n переход можно получить химическим, электролитическим способом, либо путем внедрения атомов примеси методом диффузии или ионной бомбардировкой. Механическим способом p-n переход получить не удается из-за малости толщины контактного слоя по сравнению с неровностями поверхности образцов. Обычно толщина контактного слоя менее 10 мкм. Поскольку собственный полупроводник один и тот же, то ∆ε0 и размеры зон у них одинаковы, хотя электрохимические потенциалы разные, в нашем случае µэp < µэn (рис. 3.14.1). В процессе введения в контакт происходит выравнивание уровней электрохимических потенциалов и постепенное установление термодинамичекого равновесия между носителями заряда в исходных полупроводниках. Этот процесс идет в результате диффузии квазиэлектронов из n- в р-полупроводник и дырок из р- в n-полупроводник. Наглядно все это можно представить следующим образом (рис. 3.14.1). При соприкосновении полупроводников электроны с донорных уровней преимущественно переходят не в зону проводимости, а на расположенные вблизи валентной зоны акцепторные уровни. На этих уровнях они локализуются вблизи атомов примеси и в образовании тока проводимости участвовать не могут. Такие переходы эквивалентны обратному переходу дырок с примесного акцепторного уровня на примесный донорный уровень. Возникшие на примесном уровне
180
дырки также перемещаться не могут, они локализованы вблизи атомов примеси. Z
Z
сближение n
n
p
-
ε 0
L1 L 2 + + -
p
yε
µэn
µ эp
+
y
0
ε2
-
ε1 а
y y
eUк
Фne
-
-
Фpe Фnд +
Фpд +
µ эn = µ эp
eUк
б
Рис. 3.14.1. Контактный слой: а – диффузия частиц в контактном слое, б – энергии носителей в контактном слое Итак, после контакта происходит процесс диффузии носителей заряда, причем в процессе диффузии уровень электрохимического потенциала µ эn постепенно опускается вниз и после выравнивания электрохимических потенциалов µ эn и µ эp дальнейшего переноса избыточного количества зарядов через контактный слой происходить не будет. Однако в результате такого процесса нарушается электрическая нейтральность исходных полупроводников. С одной стороны, электроны и дырки, переходя через границу раздела, оставляют после себя неподвижные ионы донорных и акцепторных атомов (рис. 3.14.1, а), а, с другой стороны, увеличивается концентрация электронов вблизи контакта в области р-полупроводника и дырок – в области n-полупровод-ника, контактная область р-полупроводника оказывается заряженной отрицательно, а контактная область n-полупроводника оказывается заряженной положительно. На участке L = L1 + L2 возникает электрическое поле, созданное двумя слоями объемных зарядов. Таким образом, вблизи границы раздела электронного и дырочного полупроводников возникают области положительных и отрица-
181
тельных объемных зарядов. За пределами контактного слоя в каждом из полупроводников объемных зарядов не существует. Но в результате таких переходов в пределах контактного слоя искривляются зона проводимости и валентная зона. Как следствие этого, возникает контактная разность потенциалов, которая одновременно является и внутренней и внешней. Внутренней она является потому, что в области контакта энергия зон изменяется на величину eUк , а внешней – потому, что между точками, расположенными над поверхностями контактирующих полупроводников, возникает разность потенциалов. Эта контактная разность потенциалов не имеет специального названия. Почему же возникает, на первый взгляд, такое странное обстоятельство, когда внешняя и внутренняя контактные разности потенциалов равны между собой? Внешняя и внутренняя контактные разности потенциалов имеют разное физическое происхождение: внешняя определяется разностью работ выхода электронов, внутренняя – взаимным расположением уровней электрохимических потенциалов. А так как в данном случае предполагается, что примесные полупроводники созданы на основе одного и того же собственного полупроводника, то внешняя и внутренняя контактные разности потенциалов равны между собой. Если бы это было не так, то внешняя контактная разность потенциалов отличалась бы от внутренней. С учетом вышеизложенного, внешняя контактная разность потенциалов 1 1 (3.14.1) U к = (Ap − An ) = (µ эp − µ эn ), e e Аp, Аn – работа выхода электрона из р- и n-полупроводников, е>0. После установления термодинамического равновесия в области контакта имеют место следующие потоки квазичастиц (рис. 3.14.1, б). Пусть квазиэлектрон с энергией ε < ε2 движется из n- в рполупроводник. В области контакта он попадает в тормозящее для него электрическое поле, постепенно теряет энергию и возвращается обратно в n-полупроводник. С другой стороны, любая дырка с энергией ε < ε1 при движении в сторону n-полупроводника также попадает в тормозящее электрическое поле и возвращается обратно. Но если энергия квазиэлектронов в n-полупроводнике ε > ε2 , а энергия дырок в р-полупроводнике ε > ε1, то квазиэлектроны и дырки преодолеют контактный слой и соответственно попадут в р- и n-полупроводники. У примесных полупроводников всегда имеется некоторое число таких квазиэлектронов и дырок. Поэтому там возникают различные диффузионные потоки квазичастиц.
182
Из постановки задачи следует, что через контактный слой должны протекать четыре потока квазичастиц (рис. 3.14.1, б). Рассмотрим их отдельно. 1. Диффузионные потоки Фne и Фpд возникают из-за изменения концентраций в пределах образца как у квазиэлектронов, так и у дырок. Их направления указаны на рис. 3.14.1, б. 2. В р-полупроводнике в зоне проводимости неосновными носителями заряда являются квазиэлектроны, в n-полупроводнике в валентной зоне – дырки. Благодаря хаотическому движению некоторое число квазичастиц попадают в контактный слой, ускоряются электрическим полем контактного слоя и переносятся, соответственно: квазиэлектроны – в nполупроводник, дырки – в р-полупроводник. Возникают потоки Фne и Фpд. Уравнение баланса потоков этих квазичастиц: Фne + Фpд = Фpe + Фnд . А так как поток квазичастиц Ф = I / q*, q* – эффективный заряд квазичастицы, I – электрический ток квазичастиц, то Inд + Ipe = Ine + Ipд .
(3.14.2)
В отсутствие действия внешнего источника тока напряженность электрического поля Е = 0, ток проводимости в образце отсутствует, диффузионный ток равен току проводимости: (3.14.3) Iдиф = Iпров , где Iдиф = Ine + Ipд , Iпров = Inд + Ipe . 3.15. Физические особенности контактного слоя в p-n полупроводнике
Как было установлено в разделе 3.12, в процессе контакта n- и pполупроводников в пространстве между ними возникает слой конечной толщины, обедненный носителями заряда. В этом контактном слое возникают объемные заряды, локализованные вблизи атомов примесей, поэтому эти заряды под действием поля в пространстве перемещаться не могут, следовательно, не могут участвовать в образовании тока проводимости. Оценим теперь толщину контактного слоя и выясним, от каких параметров вещества зависит его толщина. Для дальнейшего анализа
183
первоначально предположим, что к полупроводнику внешний источник тока не подключен (рис. 3.15.1). Ln
Lp
++ -++ --
n 0
p
Ln L = Ln + Lp
x
Рис. 3.15.1. Объемный заряд в области p-n перехода Температура полупроводника такова, что в результате перехода электронов с примесных уровней в зону проводимости все примесные уровни n-полупроводника свободны, а в результате перехода электронов из валентной зоны р-полупроводника на примесные уровни все примесные уровни оказываются занятыми электронами. Это условие будет выполняться либо при достаточно высокой температуре образца, либо когда донорный уровень расположен в непосредственной близости к зоне проводимости n-полупроводника, а акцепторный уровень расположен в непосредственной близости к валентной зоне. Все дальнейшие рассуждения проведем только для области контактного слоя L = Ln + Lp (рис. 3.15.1). В общем случае объемная плотность зарядов в области контактного слоя имеет разный знак и разную пространственную протяженность. Выберем начало координат на левой границе положительного заряда n-полупроводника (рис. 3.15.1). Введем следующие обозначения для объемных плотностей зарядов в n- и p-полупроводниках: 0 < x < Ln , ρn = - en дон , Ln < x < L , ρp = en а , e < 0. Здесь nдон – концентрация атомов примеси в n-полупроводнике (концентрация донорных уровней), nа – концентрация атомов примеси в рполупроводнике (концентрация акцепторных уровней). Предполагаем, что в области контактных слоев Ln и Lp концентрация объемных зарядов при различных значениях x сохраняется неизменной. Так как р-полупроводник заземлен, то n-полупроводник оказывается положительно заряженным относительно р-полупровод-ника. Следовательно, в области контакта происходит постепенное изменение потенциала. Для определения изменения потенциала в области контактного слоя L воспользуемся уравнением Пуассона. Тогда в контактном слое толщиной Ln уравнение Пуассона
184
d 2ϕn e nдон (3.15.1) =− 2 ε0 ε dx при следующих граничных условиях: dϕ n ϕn | x= Ln = U к > 0 , | x=0 = 0 , eU к < 0 . dx Решением уравнения (1) является e (3.15.2) ϕ0 − U к = nдон L2n , 2ε 0 ε φ0 – потенциал на границе раздела n- и р-полупроводников. В контактном слое толщиной Lp уравнение Пуассона d 2ϕ p e (3.15.3) = nа 2 ε0 ε dx при граничных условиях dϕ p ϕ p | x= L = 0 , | x= L = 0 . dx Решением уравнения (3.15.3) является e ϕ0 = nа L2p . (3.15.4) 2ε 0 ε Подставим найденное из (3.15.4) значение φ0 в уравнение (3.15.2): e e na L p2 − U к = − nдон Ln2 . 2ε 0 ε 2ε 0 ε Отсюда внутренняя контактная разность потенциалов e Uк = nдон Ln2 + nа L p2 . (3.15.5) ε0 ε Как следует из (3.15.1) и (3.15.3) с учетом граничных условий, dϕ n e ⎫ nдон ⋅ x , =− ⎪ dx ε0 ε ⎪ (3.15.6) ⎬. dϕ p e nа x − Ln − L p .⎪ = ⎪⎭ ε0 ε dx Так как на границе раздела градиент потенциала должен быть непрерывным, то ⎛ dϕ n dϕ p ⎞ ⎜⎜ ⎟ . = (3.15.7) dx ⎟⎠ x= L ⎝ dx
(
)
(
)
n
185
После подстановки значений (3.15.6) в (3.15.7) получаем nдон Ln = nа Lp или 2 ⎛ nдон ⎞ 2 2 (3.15.8) ⎟⎟ Ln . L p = ⎜⎜ n ⎝ а ⎠ Найденное значение Lp2 подставляем в (3.15.5): Uк =
e nдон (nдон + na ) Ln2 . 2ε 0 ε n a
Отсюда 1
⎛ 2ε ε na ⎞2 Uк ⎟⎟ . Ln = ⎜⎜ 0 ⎝ e nдон nдон + na ⎠ Значение Ln из (3.15.9) подставим в (3.15.8): 1/ 2
⎛ 2ε ε n ⎞ Uк ⎟⎟ L p = ⎜⎜ 0 дон ⎝ e na nдон + na ⎠
.
(3.15.9)
(3.15.10)
Толщина контактного слоя L = Ln + L p , тогда, как следует из (3.15.9) и (3.15.10), 1/ 2
⎛ 2ε ε n + na ⎞ L = ⎜⎜ 0 дон U к ⎟⎟ . (3.15.11) ⎝ e nдон + na ⎠ Если к концам полупроводника приложена внешняя разность потенциалов U, то в полупроводнике будет протекать электрический ток. Но контактный слой обеднен свободными носителями заряда, значит, он обладает электрическим сопротивлением, значительно превышающим электрическое сопротивление остального полупроводника, при этом основное падение напряжения будет происходить в контактном слое, а внешнее напряжение U будет суммироваться с внутренней контактной разностью потенциалов Uк. Тогда формулы (3.15.9)–(3.15.11) можно видоизменить: ⎫ ⎪ ⎪ ⎪ 1/ 2 ⎛ 2ε 0 ε nдон U к + U ⎞ ⎪⎪ ⎟⎟ , ⎬ Ln = ⎜⎜ ⎝ e na nдон + na ⎠ ⎪ 1/ 2 ⎪ ⎛ 2ε ε n + na ⎞ (U к + U )⎟⎟ .⎪⎪ L = ⎜⎜ 0 дон e n n ⋅ дон a ⎝ ⎠ ⎪⎭ 1/ 2
⎛ 2ε ε na U к + U ⎞ ⎟⎟ Ln = ⎜⎜ 0 ⎝ e nдон nдон + na ⎠
,
(3.15.12)
186
причем внешняя разность потенциалов U может быть как положительной, так и отрицательной. Из (3.15.12) следует, что ширина контактного слоя L будет меняться в зависимости от величины и знака разности потенциалов U и, в общем случае, L n ≠ L p. Если же Uк + U = 0, то в области контактного слоя возникает пробой. В табл. 3.15.1 приводятся результаты вычислений по формулам (3.15.9)– (3.15.11) толщины контактных слоев Ln, Lp, L = Ln+Lp для Si. Вычисления выполнены для ε = 11,7 эВ, Uк = 1 В. Из табл. 3.15.1 видно, что толщина контактного слоя сильно зависит от концентрации примесей, наибольшей величины она достигает у полупроводников с малой концентрацией. При высокой концентрации толщина контактного слоя очень мала и с увеличением концентрации стремится к нулю. Так как электрическое сопротивление контактного слоя велико, то любое его изменение должно сильно влиять на электропроводность полупроводников. Согласно (3.15.12), толщина контактного слоя L зависит от величины и знака приложенной внешней разности потенциалов U, она определенным образом влияет на величину протекающего через контакт тока. В результате электрическое сопротивление контактного слоя для +U и -U оказывается различным по величине, и это различие может быть весьма значительным. На этом основано выпрямляющее действие p-n перехода, поскольку с изменением знака разности потенциалов U будет меняться как толщина контактного слоя L, так и его электрическое сопротивление. n дон, м -3 21
1⋅10 1⋅1021 1⋅1022 1⋅1022 1⋅1022 1⋅1023
n а, м -3 1⋅1022 1⋅1021 1⋅1021 1⋅1023 1⋅1022 1⋅1022
Ln, мкм
Lp, мкм
Ln / Lp
L, мкм
1,08 0,80 11 0,34 0,25 0,034
0,11 0,80 1,08 0,034 0,25 0,34
10 1 0,1 10 1 0,1
1,19 1,60 1,19 0,37 0,50 0,37
Таблица 3.15.1. Толщины контактных слоев Ln, Lp, L=L +Lp для Si
187
3.16. Контакт металл - полупроводник Рассмотрим первоначально контакт металла с n-полупроводником, у которых уровни электрохимических потенциалов не совпадают, µэм < µэп (рис. 3.16.1).
y металл
п/п
ε
x
0 З.п.
З.п
З.п
x µ эп
В.з
dn dε
Рис. 3.16.1. Контакт металл-полупроводник (з. п. – зона проводимоdn сти; в. з. - валентная зона; – распределение по энергиdε ям концентрации электронов в з. п. металла) Так как уровень электрохимического потенциала металла расположен ниже уровня электрохимического n-полупроводника, то в процессе их сближения возникает направленный перенос электронов из nполупроводника в металл. Избыточный перенос продолжается до полного выравнивания уровней электрохимических потенциалов, после чего в области контакта у n-полупроводника возникает слой, обедненный свободными носителями заряда. Возникшие там положительные заряды локализованы вблизи атомов примеси и перемещаться не могут (рис. 3.16.2). Из-за незначительной концентрации квазиэлектронов в контактном слое этот слой обладает большим электрическим сопротивлением и называется запорным слоем. В области контактного слоя должны существовать два потока квазичастиц: Ф ме – поток квазиэлектронов из металла в полупроводник и
188
Ф пе – поток квазиэлектронов из полупроводника в металл. Они равны между собой. Дырки в валентной зоне n-полупроводника – неосновные носители заряда, их концентрация значительно меньше концентрации квазиэлектронов в зоне проводимости. Поэтому потоком дырок через контактный слой можно пренебречь. y + металл + п/п
ε 0
x Фме З.п.
x З.п
Фпе
-
µ эп З.п
dn dε
В.з
Рис. 3.16.2. Возникновение барьера Шоттки (з. п. – зона проводимости; в. з – валентная зона; dn – распределение по энергиям конdε центрации электронов в з. п. металла) Возникший в области контакта положительный заряд проводит к искривлению всех уровней полной энергии n-полупроводника, приводит к возникновению потенциального барьера, который называется барьером Шоттки (рис. 3.16.2). Теперь приложим к образцам внешнюю разность потенциалов (рис. 3.16.3). Так как εп = eφ , φ > 0, е < 0, то все уровни полной энергии n-полупроводника смещаются вниз, электрохимический потенциал n-полупроводника µэп = µ + eφ (3.16.1) также понижается. В такой замкнутой цепи возникает электрический ток. Наибольшее электрическое сопротивление приходится на запорный слой, поэтому основное падение напряжения происходит в запорном слое, падение напряжения на остальных участках цепи незначительно.
189 Iобр
ϕ
y
-
металл
+ +
+
п/п x
ε
x eϕ
0 Фме -
Фпе -
µ эп
Рис. 3.16.3. Контактный слой во внешнем поле (запорное направление) Квазиэлектроны металла, попадая в электрическое поле контактного слоя, переносятся в n-полупроводник. В то же время на пути движения квазиэлектронов из n-полупроводника находится потенциальный барьер, высота которого возросла по сравнению с первоначальной. Поэтому поток квазиэлектронов в сторону металла уменьшается. В результате приложенной разности потенциалов с указанной на рис. 3.16.3 полярностью один поток остается неизменным, а второй уменьшается, возникает разностный поток квазичастиц ∆Фe = Фме - Фпе. (3.16.2) Значит, в замкнутой цепи будет протекать электрический ток ⎛ ⎛ eϕ ⎞ ⎞ I обр = I 0 ⎜⎜ exp⎜ − (3.16.3) ⎟ − 1⎟⎟ , e > 0 . ⎝ kT ⎠ ⎠ ⎝ Его физическое происхождение вызвано преобладающим влиянием тока проводимости из металла над диффузионным током из полупроводника. Приложим теперь внешнюю разность потенциалов обратного знака. Тогда уровень электрохимического потенциала n-полупроводника по сравнению с исходным поднимется вверх, все уровни полной энергии n-полупроводника также поднимутся вверх. В результате высота потенциального барьера понизится (рис. 3.16.4). Но положение уров-
190
ней полной энергии в металле при этом не изменится, не изменится и величина потока квазиэлектронов из металла в сторону полупроводника. Значит, поток проводимости квазиэлектронов из металла сохраняется прежним. Что же касается диффузионного потока квазиэлектронов из полупроводника в сторону металла, то в результате уменьшения высоты потенциального барьера он возрастет, через контактный слой пройдет результирующий поток квазичастиц ∆Ф = Фпе - Фме , (3.16.4) будет протекать электрический ток (прямой ток) ⎛ ⎛ eϕ ⎞ ⎞ I пр = I 0 ⎜⎜ exp ⎜ ⎟ −1⎟⎟ , e < 0 . (3.16.5) ⎝ kT ⎠ ⎠ ⎝ Этот ток имеет в основном диффузионное происхождение. Iпр
ϕ
y
+
металл
+ +
-
п/п x
ε 0 Фме -
eϕ x - Ф пе
µэ
Рис. 3.16.4. Контактный слой во внешнем поле (прямое направление) Таким образом, омический контакт, запорный слой должен обладать выпрямляющим для переменного тока действием. На основе этого явления созданы и широко используются диоды Шоттки. Их замечательной особенностью является необычно малое время релаксации – порядка 10-11 с, что позволяет с успехом их применять в импульсных радиотехнических схемах, вычислительной технике, автоматике, т.е. там, где требуется высокое быстродействие, способность обрабатывать возможно более короткие и часто следующие друг за другом электрические импульсы.
191
y
y металл
п/п
ε
металл x
0 З.п.
З.п
µэм
x µ эп
-
п/п
ε
x
0 З.п
x
З.п.
µэ З.п
З.п
В.з
В.з
а
б
Рис. 3.16.5. Возникновение антизапорного слоя Рассмотрим теперь контакт металла с n-полупроводником, у которого уровень электрохимического потенциала больше уровня электрохимического потенциала полупроводника (рис. 3.16.5). В результате после контакта в полупроводник переходит некоторое число электронов, в контактном слое полупроводника возникает отрицательно заряженный слой, который называется антиза-запорным слоем (рис. 3.16.5, б). Электрическое сопротивление антизапорного слоя очень мало, поэтому такой контакт не обладает выпрямляющим свойством. Тем не менее, он широко применяется для создания омических контактов, с помощью которых полупроводник, полупроводниковые устройства подключаются к электрическим схемам. 3.17. Соотношение Эйнштейна
Предположим, что в объеме образца в направлении координатной оси 0Х происходит изменение концентрации заряженных частиц идеального газа n(x). Электрический заряд частицы q. Кроме того, в объеме существует электрическое поле Е, направление которого противоположно градиенту концентрации ∇n(x ) . В результате наличия градиента концентрации в объеме возникает диффузия заряженных частиц, направленная в одну сторону, и поток проводимости (дрейфовый поток), направленный в противоположную сторону.
192
Тогда полный ток будет складываться из дрейфового тока (тока проводимости) и диффузионного тока, направления которых противоположны. Следовательно, в любой точке полупроводника для произвольного момента времени плотность тока равна сумме диффузионного и дрейфового токов (тока проводимости): j = je + jд . В отсутствие внешнего источника тока (3.17.1) je = - jд . Из первого закона Фика следует: плотность тока диффундирующих заряженных частиц dn (3.17.2) jд = −qD , dx q – заряд частицы, D – коэффициент диффузии. Плотность дрейфового тока (тока проводимости) je = q v n , (3.17.3) где n – концентрация, – дрейфовая скорость носителей заряда: v = bE, b – подвижность носителей заряда, Е – напряженность электрического поля. После подстановки значения в (3.17.3) получаем je = qbnE . (3.17.4) Найденные в (3.17.2), (3.17.4) значения jд , je подставляем в (3.17.1): dn (3.17.5) qbn E = q D . dx Для заряженных частиц идеального газа, находящихся в электрическом поле консервативных сил, справедливо распределение Больцмана, согласно которому концентрация зависит от величины потенциальной энергии частицы в данной точке пространства и температуры. Если принять q = e > 0, то eϕ kT
dn e dϕ =− , n (3.17.6) dx kT dx φ – потенциал электростатического поля. Напряженность электрического поля в полупроводнике dϕ E=− . (3.17.7) dx Поэтому после подстановки dn и E из (3.17.6) и (3.17.7) в (3.17.5) и dx сокращения на постоянные множители получаем: n = n0 e
−
,
193
D kT (3.17.8) = . b e Уравнение (3.17.8) называется соотношением Эйнштейна. Оно справедливо для системы частиц с малой концентрацией, когда взаимодействиями между частицами можно пренебречь. К таким частицам, в частности, относятся квазиэлектроны и дырки в собственных и примесных полупроводниках.
3.18. Выпрямляющее действие p-n перехода
В любом полупроводнике одновременно происходят два противоположно направленных процесса: а) генерация квазиэлектронов и дырок; б) рекомбинация квазиэлектронов и дырок. В результате в объеме между этими процессами устанавливается динамическое равновесие. Основными механизмами рекомбинации являются излучательный механизм, когда энергия рекомбинирующей пары квазиэлектрон–дырка излучается в виде фотона; фононный механизм, когда энергия рекомбинирующей пары передается ионам кристаллической решетки; ударный механизм, когда энергия рекомбинирующей пары передается третьей частице. Возникающий на границе раздела n- и p-образцов контактный слой обладает рядом физических особенностей. Если, например, к концам p-n образца приложить переменную разность потенциалов, то оказывается, что p-n переход будет обладать преимущественно односторонней проводимостью, а, следовательно, и выпрямляющим действием. На рис. 3.18.1 изображен контакт n- и p-полупроводников, цифрами 1 и 2 обозначены границы контактного слоя, Фne, Фpд – потоки основных носителей заряда, Фpe, Фnд – потоки неосновных носителей заряда. Как следует из физического смысла рис. 3.18.1, концентрация квазиэлектронов в p-образце в результате рекомбинаций квазиэлектронов и дырок с увеличением расстояния от границы контактного слоя уменьшается. Найдем закон изменения концентрации. Пусть τe – среднее время жизни квазиэлектронов в p-полупроводнике, в котором они являются неосновными носителями заряда. Тогда в отсутствии диффузии из р- в n-образец изменение концентрации по глубине будет происходить только в результате рекомбинации квазиэлектронов зоны проводимости с дырками валентной зоны. Следовательно, изменение концентрации во времени ∂n n0 − n , = ∂t τe
194
n0 – равновесное значение концентрации квазиэлектронов. 1
y n x1
ε
2 + + -
p x2
x
0
Фne
x
Фne
µэ Фpд +
Фpд +
eUк
Рис. 3.18.1. Потоки носителей зарядов через p-n переход С другой стороны, в отсутствие рекомбинаций изменение концентрации во времени определяется 2-м законом Фика: ∂n ∂ 2n = De 2 , ∂t ∂x где De – коэффициент диффузии квазиэлектронов в р-образце (коэффициент диффузии неосновных носителей заряда). Так как оба процесса в образце существуют одновременно, то ∂n n0 − n ∂ 2n = + De 2 . ∂t τe ∂x При наличии динамического равновесия ∂n = 0 , поэтому ∂t ∂2n n0 − n . = ∂x2 Deτ e Обозначим λe = De τ e , (3.18.1) ℓe – диффузионная длина квазиэлектронов (неосновных носителей заряда) в р-образце. Тогда d 2 (n − n0 ) n − n0 (3.18.2) . = dx 2 λ2e
195
Непосредственной подстановкой можно показать, что решением дифференциального уравнения (3.18.2) является n ( x) = n0 + c1 e
−
x + x2 λe
(3.18.3)
,
где λe + x2
c1 = −n0 e λe , n (λe ) = 0 . Тогда после подстановки найденного значения c1 в уравнение (3.18.3) получаем: ⎛ ⎛ x − λe ⎞ ⎞ ⎟⎟ ⎟ , n ( x) = n0 ⎜1 − exp⎜⎜ ⎜ ⎟ (3.18.4) ⎝ λe ⎠ ⎠ ⎝ x ≤ λe Уравнение (3.18.4) позволяет дать физически обоснованное определение диффузионной длины квазиэлектронов в р-образце: диффузионная длина ℓe –это то расстояние, на котором в результате рекомбинаций квазиэлектронов и дырок неосновные носители заряда полностью исчезают: квазиэлектроны – в зоне проводимости рполупроводника, дырки – в валентной зоне n-полупроводника. Оценим теперь величину диффузионной длины квазиэлектронов ℓe и дырок ℓд в примесных полупроводниках n- и р-типа на основе Si и сравним ее с толщиной контактного слоя L. Для уменьшения объема вычислений предположим, что nдон = nакц, а температура образца Т = 300К. Из опыта известны подвижности квазиэлектронов be и дырок bд в этих полупроводниках и времена жизни. Необходимые для вычисления диффузионной длины по формуле (3.18.1) значения коэффициента диффузии вычислим по формуле соотношения Эйнштейна. В табл. 3.18.1 представлены результаты таких вычислений для двух концентраций неосновных носителей заряда.
nдон = nакц м-3 1⋅1022 1⋅1021
bд be м2/(В·с) 0,074 0,140
0,038 0,046
τe
τд с
0,72 50
10,5 167
De
м2/с
1,9·10-3 3,6·10-3
Dд
9,9·10-4 1,2·10-4
ℓe
ℓд см
3,7 42,4
10,2 44,7
Таблица 3.18.1. Динамические характеристики неосновных носителей заряда в Si Из таблицы 3.18.1 следует, что диффузионная длина ℓe неосновных носителей заряда в десятки тысяч раз превышает толщину контактно-
196
го слоя. Поэтому при движении в сторону контактного слоя последний не может оказать на них заметного влияния. Квазиэлектроны в р-образце появляются из n-образца в результате прохождения через контактный слой L = Le + Lд. Как следует из табл. 3.18.1, в полупроводниках ℓe >> L, а так как концентрация квазиэлектронов в р-образце всегда мала, то квазиэлектроны в полупроводнике образуют ЭФГ, обладающий, как известно, свойствами идеального газа. В результате контакта n- и р-полупроводников в области контактного слоя толщиной L возникает электрическое поле, замедляющее движение квазиэлектронов из n- в р-образец. Поэтому в пределах контактного слоя происходит постепенное изменение потенциальной энергии квазиэлектронов, что в соответствии с распределением Больцмана приводит к изменению их концентрации. В отсутствии приложенной внешней разности потенциалов концентрация квазиэлектронов на правой границе контактного слоя в точке x2 −
− eU к
n ( x2 ) 0 = n ( x1 ) e kT , (3.18.5) где n(x1) – концентрация квазиэлектронов на левой границе x1 контактного слоя. Так как контактный слой обеднен основными носителями заряда, то он обладает электрическим сопротивлением, во много раз превышающим электрическое сопротивление остального р-n полупроводника. Поэтому, если к p-n-полупроводнику приложена внешняя разность потенциалов, то практически все падение напряжения U будет в области контактного слоя L. Тогда концентрация квазиэлектронов на правой границе изменится и окажется равной −
eU kT .
n ( x2 ) = n ( x 2 ) 0 e (3.18.6) Возникшее изменение концентрации квазиэлектнов в точке x2 ⎛ − eu ⎞ ne = n ( x2 ) 0 ⎜ e kT − 1⎟ . (3.18.7) ⎜ ⎟ ⎝ ⎠ После подстановки в (3.18.7) значение (3.18.3) получаем x + x2 ⎞ ⎛ ⎞ ⎛ − eU − ⎜ λe ⎟ ⎜ kT − 1⎟ . ne = ⎜ n ( x2 ) 0 + c1e e (3.18.8) ⎟⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ Так как плотность тока квазиэлектронов в р-образце
197
je = eDe
dne , dx
(3.18.9)
то с учетом (3.18.3) и (3.18.8) получаем: ⎛ − eU ⎞ De je = e ne ( x2 ) ⎜ e kT − 1⎟ . (3.18.10) ⎜ ⎟ λe ⎝ ⎠ Проведя аналогичные преобразования для дырок, получаем ⎞ ⎛ − eU Dд jд = e nд ( x2 ) ⎜ e kT − 1⎟ . (3.18.11) ⎟ ⎜ λд ⎠ ⎝ Тогда результирующая плотность тока квазиэлектронов и дырок равна ⎛ − eU ⎞ j = jS ⎜ e kT − 1⎟ , (3.18.12) ⎜ ⎟ ⎝ ⎠ где ⎛D ⎞ D (3.18.13) j S = e⎜⎜ e ne + д nд ⎟⎟ , λд ⎠ ⎝ λe jS – плотность тока насыщения. Найденное из (3.18.1) выражение для коэффициента диффузии подставим в (3.18.13): ⎞ ⎛λ λ (3.18.14) jS = e⎜⎜ e ne + д nд ⎟⎟ . τд ⎠ ⎝ τe Так как рекомбинация квазиэлектронов и дырок или их генерация вызваны переходами из зоны проводимости в случае рекомбинации и, наоборот, из валентной зоны в зону проводимости – в случае генерации, то времена жизни квазиэлектронов τe и дырок τд обычно достаточно велики. Что же касается обычных столкновений, при которых число неосновных носителей заряда сохраняется неизменным, то они происходят соответственно в пределах одной и той же зоны, такие столкновения приводят лишь к внутризонным переходам неосновных носителей заряда. Экспериментальные оценки показывают, что время жизни носителей заряда в результате межзонных переходов находится в интервале 10-8 с ≤ τд ≤ 10-3 с, а время жизни неосновных носителей заряда в результате внутризонных столкновений составляет 10-13 с ≤ τe ≤ 10-12 с. Подставим в (3.18.13) значение коэффициента диффузии, найденного из соотношения Эйнштейна. После сокращения на постоянные множители имеем:
198
⎛b b ⎞ (3.18.15) jS = kT ⎜⎜ e + д ⎟⎟ . ⎝ λe λд ⎠ Пусть в уравнении (3.18.12) U > 0. Тогда добавочная потенциальная энергия квазиэлектрона eU < 0. Это приводит к тому, что все зоны n-полупроводника будут смещаться вниз (рис. 3.18.1). И теперь на пути движения квазиэлектронов встретится потенциальный барьер, величина которого возросла на |eU|. Поэтому теперь не все квазиэлектроны из диффузионного потока n-образца смогут преодолеть потенциальный барьер. Что же касается тока проводимости, по-прежнему существующего в р-полупроводнике, то его величина практически не изменится, так как квазиэлектроны р-полупроводника, достигнув границы контактного слоя, попадают в ускоряющее электрическое поле и перебрасываются в n-полупроводник. В результате через контактный слой L будет протекать разностный ток, состоящий из дрейфового и диффузионного токов, направление тока будет определяться током проводимости (дрейфовым током), а сам ток имеет малую величину. Указанный разностный ток называется обратным током: ⎛ − |e U | ⎞ ⎜ ⎟ jобр = js ⎜ e k T − 1⎟ . (3.18.16) ⎜ ⎟ ⎝ ⎠ Если же U < 0, то eU > 0. Поэтому зона проводимости смещается вверх, высота потенциального барьера на пути движения квазиэлектронов в р-образец уменьшается, через контактный слой будет протекать ток большей величины по сравнению с первоначальной. Теперь диффузионный поток больше потока проводимости, а направление разностного тока будет совпадать с направлением диффузионного тока. Этот ток называется прямым током: ⎛ eU ⎞ ⎜ ⎟ jпрям = js ⎜ e k T − 1⎟. (3.18.17) ⎜ ⎟ ⎝ ⎠ Как видно из уравнений (3.18.16), (3.18.17), прямой и обратный токи сильно зависят от температуры, с ростом температуры выпрямляющее действие p-n перехода резко убывает. Для количественной характеристики выпрямляющего действия pn перехода вводится коэффициент выпрямления
K=
jпрям jобр
.
(3.18.18)
199
T, K U, B
300
0,1 0,2 0,3 0,4
47,7 2274 1,1·105 5,1·106
350
400
450
K = jпрям / jобр 27,5 754 2,1·104 5,7·105
18,1 329 5,8·103 1,1·105
13,2 113 2,3·103 3,0·104
Таблица 3.18.2. Значения коэффициентов выпрямления при различных значениях разности потенциалов U в интервале температур 300–450 К В табл. 3.18.2 приведены значения коэффициентов выпрямления при различных значениях разности потенциалов U в интервале температур 300–450 К. Из табл. 3.18.2 видно, что коэффициент выпрямления К p-n перехода сильно зависит от величины внешней разности потенциалов U и температуры. Так как полупроводник с p-n переходом по отношению к переменному электрическому току обладает односторонней проводимостью, т.е. выпрямляющим действием, то он называется полупроводниковым диодом. Если сравнивать выпрямляющее действие полупроводникового диода с выпрямляющим действием двухэлектродной лампы, состоящей только из катода и анода, то у вакуумного диода коэффициент выпрямления не зависит ни от температуры катода, ни от разности потенциалов между анодом и катодом, что является несомненным их преимуществом перед полупроводниковым диодом. Однако большим достоинством полупроводниковых диодов являются их малые габариты и отсутствие дополнительного источника тока для питания катода, что всегда имеет место в вакуумном диоде. 3.19. Транзисторы
Транзистор – это устройство, состоящее из трех полупроводников и двух p-n переходов, используемое для управления электрическим током, протекающим через него. Транзисторы применяются для усиления, генерации или переключения токов. Когда к полупроводниковому диоду добавляется третий слой полупроводника, то получается устройство, которое может усиливать мощность или напряжение. Это устройство и называется транзистором. Транзистор состоит из трех областей с чередующимся типом проводимости: n-p-n или p-n-p.
200 y
p
n
n x
ε
x
0
− −
−
−
µэ + +
+ +
Рис. 3.19.1.Энергетические зоны в n-p-n транзисторе На рис. 3.19.1 изображена принципиальная схема транзистора n-pn, а также расположение валентной зоны и зоны проводимости. Так как к транзистору внешняя разность потенциалов не приложена, то уровень электрохимического потенциала µэ всюду один и тот же. Из условия динамического равновесия вытекает равенство потоков, протекающих через контактные слои в прямом и обратном направлениях: Φn e − Φ p e = Φ p д − Φn д. (3.19.1) Отсюда следует, что в областях n-p, p-n переходов должно иметь место равенство токов: диффузионный ток Iдиф равен дрейфовому току (току проводимости) Iпров: I pe + In g = I p g + I ne. (3.19.2) Однако если к транзистору подключить внешние источники тока, как это показано на рис. 3.19.2, то расположение уровней электрохимического потенциала в n-полупроводниках изменится. А так как в данном случае p-полупроводник заземлен, то в нем уровень электрохимического потенциала останется прежним. Тогда в соответствии с изменением положения уровня электрохимического потенциала изменятся и положения зон проводимости и валентных зон в полупроводниках. На рис. 3.19.2 левый n-полупроводник называется эмиттером, правый n-полупроводник – коллектором, а средний р-полупроводник – базой. Если сравнивать транзистор с аналогичной по своему действию электронной лампой-триодом, то происхождение названий эмит-
201
тер, база, коллектор можно объяснить следующим образом. В транзисторе эмиттер является источником носителей заряда, его роль эквивалентна катоду триода, коллектор является приемником носителей заряда, его роль эквивалентна аноду триода, что же касается p-n перехода, то он выполняет роль управляющей сетки электронной лампы. На рис. 3.19.2 приведена схема включения с общей базой. Рассмотрим принцип действия транзистора как усилителя электрических сигналов в схеме с общей базой. Как видно из рис. 3.19.2, на эмиттер подается потенциал Uэ, понижающий потенциальный барьер на границе n- и p-полупроводников. В результате концентрация квазиэлектронов в р- области и дырок в n-области резко возрастает по сравнению с равновесной. Происходит инжекция носителей зарядов. Квазиэлектроны, инжектируемые из эмиттера э в базу б, затем диффундируют к коллектору к. Если база достаточно тонкая, то практически все квазиэлектроны достигают коллектора. Действительно, попадая в электрическое поле контактного слоя, существующего между базой и коллектором, квазиэлектроны ускоряются электрическим полем p-n перехода и перебрасываются в коллекторную цепь транзистора. Геометрия транзистора выбирается такой, чтобы через базовый вывод протекал незначительный по сравнению с коллекторным ток. Uэ − + ∆ U вх ~
Rэ
Uк − +
n −−
p
э
n
ε −
Φ ne
∆U к
к
б
0
Rк
−
−
x э
к
э
Φ pe
µэ Φ pg
+
Φng +
б
Рис. 3.19.2. Включение транзистора с общей базой Предположим, что на входное сопротивление Rэ подается напряжение ∆Uвх. Это приводит к изменению тока эмиттера на величину ∆U вх ∆I э = . (3.19.3) Rэ
202
А так как Iэ ≈ Iк, то практически на ту же величину изменится и ток в цепи коллектора: ∆Iк ≈ ∆Iэ. Значит, в результате этого на сопротивлении нагрузки Rк произойдет изменение падения напряжения на величину ∆U вх = ∆I к Rк . (3.19.4) Тогда коэффициент усиления по напряжению в цепи транзистора с общей базой будет ∆U вых Rк KU = = (3.19.5) . ∆U вх Rэ Из рис. 3.19.2 следует, что эмиттерный переход включен в прямом направлении, следовательно, он обладает малым электрическим сопротивлением, в то же время коллекторный переход включен в запорном направлении, следовательно, он обладает большим электрическим сопротивлением, и к нему можно подключить сопротивление нагрузки Rк большой величины. Из опыта следует, что коэффициент усиления по напряжению находится в интервале 10 ≤ KU ≤ 50. Итак, используя транзистор с общей базой, можно получить даже в одном каскаде значительное усиление как по напряжению, так и по мощности. В настоящее время существует несколько типов транзисторов. Одним из них, кроме рассмотренного выше, является полевой транзистор, в котором рабочий ток протекает по узкому участку полупроводника. Параллельно ему расположен другой электрод (затвор), напряжение на котором определяет ширину участка с протекающим током. Например, если на затвор подается отрицательное напряжение, то оно отталкивает основные носители заряда в n-полупроводнике и, наоборот, притягивает их в р-полупроводнике. В результате участок полупроводника, в котором протекает рабочий ток, в первом случае сужается, его электрическое сопротивление возрастает, электрический ток уменьшается, а во втором случае электрический ток соответственно возрастает. Таким образом, в полевом транзисторе управление током осуществляется напряжением U, приложенным перпендикулярно направлению тока. Любой транзистор представляет собой твердотельный цилиндрик. Его изготовляют с помощью специальных технологических операций, создающих чередование p-n переходов, а также металлические контакты на полупроводниках. Такие транзисторы обладают большой механической прочностью, поэтому их можно применять в условиях боль-
203
ших вибраций и ускорений (автомобиль, ракета и т.д.). Для работы транзистора используют низковольтные источники питания (2–3 В). В 60-е годы 20-го века были разработаны интегральные микросхемы. Они изготовляются следующим образом. На диэлектрической пластине размещаются транзисторы, конденсаторы, резисторы, а также проводники, соединяющие их в определенной последовательности. В результате получаются очень компактные и взаимозаменяемые микросхемы. Уже существуют микросхемы с плотностью упаковки элементов порядка 106 мм2. Они заменили электронные блоки из отдельных транзисторов, что привело к появлению ЭВМ третьего поколения. Микросхемы применяют на заводах в станках с числовым программным управлением, в вычислительных комплексах, устройствах автоматики, связи, электронной разведки и др. 3.20. Внутренний фотоэффект в полупроводниках
Внутренним эффектом называется перераспределение электронов по энергетическим состояниям, происходящее в результате поглощения электромагнитного излучения. В полупроводниках внутренний фотоэффект проявляется в изменении величины электропроводности и называется фотопроводимостью, в изменении под действием падающего излучения относительной диэлектрической проницаемости и называется фотодиэлектрическим эффектом, в возникновении под действием излучения ЭДС и называется фотоЭДС. Физическая причина перечисленных выше эффектов заключается в особенностях расположения зон у полупроводников. Самым характерным для полупроводников процессом поглощения света является собственное поглощение, при котором электрон валентной зоны, поглотив фотон, переходит либо на примесный уровень в nполупроводнике, либо в зону проводимости. При этом энергия фотона hν = ε K − ε H , где εK, εH – энергии электрона в конечном и начальном состояниях. Собственное поглощение света возможно при hν ≥ ε, где ε=∆ε0, ∆εa, ∆εg, ∆ε0 – ширина запрещенной зоны, ∆εa – интервал энергии между верхней границей валентной зоны и акцепторным уровнем в pполупроводнике, ∆εg – интервал энергии между донорным уровнем и нижней границей зоны проводимости. При таких переходах наряду с законом сохранения энергии должен выполняться закон сохранения квазиимпульса:
204
ρ ρ ρ p = p0 + η q , ρ ρ где p0 – начальный квазиимпульс электрона, p – конечный квазиимρ пульс электрона, η q – изменение квазиимпульса электрона, возникающее в результате таких переходов. Для видимого и длинноволнового излучения η q << p0 , поэтому p ≈ p0 . Различают прямые и непрямые переходы. Прямые переходы возρ ρ никают при условии p ≈ p0 . Непрямые переходы возникают, когда ρ ρ p ≠ p0 . На основе использования внутреннего фотоэффекта созданы многочисленные виды приемников электромагнитного излучения, к их числу, в частности, относятся фоторезисторы, фотодиоды, фотоэлементы и другие, нашедшие в настоящее время самое широкое применение. Рассмотрим физические основы работы некоторых видов приемников более подробно. 3.20.1 Фоторезисторы (фотосопротивления) Фотосопротивления изготовляют из светочувствительных материалов, таких как сульфид кадмия (CdS), селенид кадмия (CdSe), являющиеся полупроводниками n-типа, а также и из других полупроводников. Светочувствительный материал наносится на изолирующую подложку из стекла или керамики. В зависимости от величины и спектрального состава падающего электромагнитного излучения электрическое сопротивление фоторезистора меняется от 100 Ом до 10 МОм. Чувствительный элемент изготовляется таким, чтобы в нем поглощалась значительная часть падающего потока электромагнитной волны: Φ погл = (1 − r ) Φ 0 , (3.20.1.1) где r – коэффициент отражения, Ф0 – величина падающего потока. Под действием поглощенного потока в полупроводнике возникают дополнительные носители заряда двух знаков. Число носителей заряда, генерируемых в чувствительном элементе за 1с, равно Φ N = η погл , (3.20.1.2) hν где η – квантовый выход внутреннего фотоэффекта. Квантовым выходом η называется число пар носителей заряда (квазиэлектронов и дырок), рождаемых в среднем каждым поглощенным фотоном.
205
Предположим, что фоторезист состоит из собственного полупроводника. Если теперь к концам фоторезиста приложить разность потенциалов U, то в резисте возникнет электрическое поле напряженностью Е. Под действием этого поля носители заряда будут перемещаться в определенном направлении, в полупроводнике возникает дрейфовый ток (ток проводимости), он называется фототоком Iф. Пусть ve – дрейфовая скорость носителей заряда одного знака, допустим квазиэлектрона, ℓ – длина резистора. Тогда время дрейфа носителя заряда через резистор λ t= . (3.20.1.3) ve U , be – подвижность квазиэлектронов, то поλ сле подстановки ve в (3.20.1.3) имеем λ2 . (3.20.1.4) t= be U Пусть τe – время жизни квазиэлектронов, тогда с учетом (3.20.1.1), (3.20.1.2), (3.20.1.4) получаем выражение для фототока квазиэлектронов τ I фе = eN e t или e ηλ (1 − r ) τe be Φ 0 U . I фе = (3.20.1.5) h c λ2 Аналогичным образом получается выражение для дырочного фототока e ηλ (1 − r ) τд bд Φ 0 U , (3.20.1.6) I фд = h c λ2 где τд – время жизни дырок, bд – подвижность дырок. Тогда полный фототок носителей заряда двух знаков будет e ηλ (1 − r ) (τe be + τд bд )Φ 0 U . Iф = (3.20.1.7) h c λ2 Время жизни носителей заряда определяет не только величину фототока, но и инерционность фоторезистора. Действительно, в результате рекомбинации квазиэлектронов и дырок концентрация носителей заряда, квазиэлектронов, появившихся в зоне проводимости, и дырок
Так как ve = be E = be
206
– в валентной зоне, как это следует из 2-го закона Фика, убывает по закону ⎛ t − t0 ⎞ (3.20.1.8) ∆n = ∆n0 exp⎜ − ⎟, τ ⎠ ⎝ где t0 – момент включения света. Поэтому по такому же закону будет меняться и фототок Iф. Из табл. 3.17.1, приведенной в разделе 3.17, следует, что время жизни носителей заряда порядка 0,1–10 с. Следовательно, фоторезисторы должны обладать значительной инерционностью. Так как время установления стационарного состояния у них достаточно велико, то для регистрации быстро протекающих процессов фоторезисторы непригодны. 3.20.2. Фотодиоды, фотоэлементы Физический принцип работы фотодиодов и фотоэлементов основан на использовании фотогальванического эффекта. Суть его заключается в следующем. При освещении потоком электромагнитного излучения p-n перехода и прилегающих к нему областей полупроводника происходят переходы электронов из валентной зоны в зону проводимости. В результате в полупроводнике возникает дополнительное число возбужденных электронов и дырок. Следовательно, как в валентной зоне, так и в зоне проводимости появляется дополнительное число носителей заряда. Процесс появления дополнительного числа носителей заряда соответственно в зонах проводимости и валентной под действием излучения называется фотогальваническим эффектом. Пусть имеется образец, состоящий из контактирующих между собой полупроводников n- и р-типа (рис. 3.20.1). Поверхность левого полупроводника облучается потоком электромагнитной волны. Предположим, что толщина n-полупроводника xn<<ℓn, ℓn – диффузионная длина квазиэлектронов в n-полупроводнике. Кроме того, xn<< xp, xp – толщина р-полупроводника, ℓn > L, L – толщина n-p перехода. Пусть Ф0 – падающий поток излучения, r – коэффициент отражения потока от n-p полупроводника. Тогда поглощенный в полупроводниках поток Φ = (1 − r ) Φ 0 = Φ n + Φ p ,
где Фn, Фp – поглощенные потоки излучения соответственно в n- и рполупроводниках.
207
U0 − + Φ0
0
hν
R p
n
1 ε
hν
U
xn
3
2 x
зона проводимос ти
µэ валентная зона
Рис. 3.20.1. Фотоэлемент: 1 - контактное металлическое кольцо, 2 – металлическое основание, 3 – область n-p перехода; xn<<ℓn Следовательно, в результате облучения значительная часть падающего первичного потока проникает в р-образец и в нем поглощается. Если в р-полупроводнике произошло поглощение кванта энергии излучения валентным электроном, то при величине энергии кванта больше ширины запрещенной зоны электрон может перейти из валентной зоны в зону проводимости, но одновременно с этим в валентной зоне образуется дырка. Возникшие в зоне проводимости рполупроводника квазиэлектроны будут неосновными носителями заряда. Что же касается n-образца, в котором также происходит поглощение излучения, то поглощенный там поток Ф0 будет возбуждать электроны валентной зоны, в результате некоторое их число перейдет в зону проводимости с одновременным возникновением в валентной зоне дырок. Но так как xn<< xp , xp – толщина р-образца, то Фn << Фp . Следовательно, концентрация вновь возникших квазиэлектронов и дырок в р-образце должна значительно превышать аналогичные концентрации в n-образце. Возникшие в зоне проводимости р-образца квазиэлектроны движутся хаотически, и некоторое их число проникает в область контактного слоя p-n перехода, там они ускоряются электрическим полем контакта и перебрасываются в n-образец. Дырки валентной зоны n-
208
полупроводника также движутся хаотически, и некоторое их число попадает в область контактного слоя и электрическим полем перебрасывается в р-полупроводник. Из физической постановки задачи следует, что потоки квазичастиц образованы неосновными носителями заряда. Заметим, основными носителями заряда в n-полупроводнике являются квазиэлектроны, а в р-полупроводнике – дырки. При диффузии в сторону контактного слоя основные носители заряда на своем пути встречают потенциальный барьер, поэтому значительное их число не в состоянии преодолеть его (рис. 3.20.1), в то же время неосновные носители легко переносятся в противоположные полупроводники ускоряющим для них электрическим полем. Итак, квазиэлектроны из р-полупроводника и дырки из nполупроводника, неосновные носители заряда, переносятся в избыточном количестве соответственно в n- и р-полупроводники. В результате n-полупроводник относительно р-полупроводника заряжается отрицательно. А так как потенциал полупроводников первоначально был положительным, то потенциальная энергия заряженных частиц уменьшается на величину ∆ε = -e∆U < 0, e – электрический заряд квазичастиц. Если теперь р-полупроводник заземлить, то все уровни полной энергии n-полупроводника в процессе переходов квазичастиц через контактный слой будут постепенно опускаться до уровня динамического равновесия. При наличии динамического равновесия между потоками основных и неосновных носителей заряда величина потенциального барьера (величина внутренней контактной разности потенциалов) возрастает на ∆U. Плотность фототока на границе контактного слоя, созданного неосновными носителями заряда, jϕ = e nотн ⋅ G , (3.20.2.1) где nотн – относительное число неосновных носителей заряда, достигающих p-n перехода в процессе диффузии без учета рекомбинации, Φp G=η , (3.20.2.2) hν η – квантовый выход фотоэффекта. Как следует из физического смысла формулы (3.17.5), изменение концентрации неосновных носителей заряда в пределах контактного слоя ⎛ q ∆U ⎞ ⎟⎟, (3.20.2.3) ∆n = n p exp⎜⎜ − ⎝ kT ⎠
209
где ∆U – изменение внутренней контактной разности потенциалов в результате появления в зоне проводимости р-полупроводника квазиэлектронов, np – концентрация добавочного числа квазиэлектронов в р-полупроводнике в результате облучения его потоком электромагнитного излучения. Тогда плотность фототока в области контактного слоя равна току проводимости: ⎛ ⎛ q ∆U ⎞ ⎞ ⎟⎟ − 1⎟ , (3.20.2.4) jф = jS ⎜⎜ exp⎜⎜ − ⎟ k T ⎠ ⎠ ⎝ ⎝
где jф определяется из (3.20.2.1), jS – плотность тока насыщения, тока, возникающего в результате теплового (термического) возбуждения, его величина может быть определена по формуле (3.17.13): ⎛n D n D ⎞ jS = e⎜⎜ e e + д д ⎟⎟. λд ⎠ ⎝ λe Из формулы (3.20.2.4) находим величину изменения внутренней контактной разности потенциалов ⎞ k T ⎛ jф (3.20.2.5) ln⎜⎜ ∆U = + 1⎟⎟. e ⎝ jS ⎠ Так как по физическому смыслу ∆U – фотоЭДС, то Uф = ∆U. Итак, если на рис. 3.20.1 U0 = 0, то полупроводник работает в режиме фотоЭДС, а сам полупроводник является фотоэлементом. Если же к р-n полупроводнику подключен источник тока и сопротивление нагрузки R, как это изображено на рис. 3.20.1, то такая электрическая схема работает в режиме фотодиода, а сам полупроводник называется фотодиодом. Фотодиоды и фотоэлементы в настоящее время нашли широкое применение. В частности, фотодиоды применяют для оптического управления током, для измерения интенсивности электромагнитного излучения. Поскольку интенсивность излучения зависит от прозрачности среды, то такие датчики могут быть индикаторами запыленности воздуха, наличия газов, поглощающих данное излучение, протекания реакций в прозрачных растворах. Их применяют также в турникетах метро, в станках-автоматах для определения количества изготовленных на них деталей и т. д. Существуют фотодиоды для различных участков спектра длин волн. Например, фотодиод на основе полупроводника InSb обладает чувствительностью к инфракрасному излучению с длиной волны 10
210
мкм, поэтому его используют в приборах ночного видения, с помощью которых можно наблюдать различные объекты в темноте. Фотодиоды обладают большим быстродействием, их время срабатывания достигает величины порядка 10-11с. Поэтому их широко используют для передачи оптической информации, в волоконнооптической связи, а также в ЭВМ. В отсутствии внешнего источника тока фотодиод является фотоэлементом. Обычное значение фотоЭДС – примерно 0,5 В. Если отдельные фотоэлементы соединить последовательно, то получается солнечная батарея. Для повышения мощности солнечные батареи соединяют параллельно, их коэффициент полезного действия может достигать 60%. Солнечные батареи являются источниками тока бортовых систем космических аппаратов. В некоторых случаях рекомбинация носителей заряда в диоде приводит к возникновению электромагнитного излучения. Такие диоды называются светодиодами. Принцип их работы следующий. При пропускании через светодиод прямого тока концентрация неосновных носителей заряда на границе p-n перехода оказывается больше равновесной. Диффундируя через p-n переход в глубь полупроводника ртипа, неосновные носители заряда при этом постепенно рекомбинируют с дырками. Этот процесс сопровождается высвечиванием квантов энергии, т.е. излучением потока электромагнитной волны. Для светодиодов геометрические размеры полупроводника подбираются такими, чтобы излучением квантов света происходило наружу. Величина свечения зависит от двух условий: • от соотношения между излучательными и безизлучательными рекомбинациями неосновных носителей заряда; • от величины угла полного внутреннего отражения. Дело здесь в том, что при малом угле полного внутреннего отражения выход излучения за пределы поверхности светодиода будет очень малым, значительная часть потока излучения будет отражаться на внешней границе раздела. Так, у полупроводника на основе GaAs угол полного внутреннего отражения примерно равен 17°. В результате лишь 2% испускаемого излучения выходит наружу. В светодиодах, созданных на основе полупроводника GaAs, ширина запрещенной зоны ∆ε = 1,4 эВ. Поэтому в результате рекомбинаций квазиэлектронов и дырок возникает инфракрасное излучение с длиной волны 0, 89 мкм. В тройном полупроводнике GaAsP можно изменять ширину запрещенной зоны и соответственно длину волны излучения. Так, на-
211
пример, из светодиода с красным свечением с помощью других примесей можно получить зеленый, синий и другие цвета свечения. На рис. 3.20.2 изображена схема оптронной пары, с помощью которой можно осуществлять преобразование напряжения в электрических схемах.
U
1
2
вх
U
вых
Рис. 3.20.2. Оптронная пара: 1– светодиод, 2 – фотоприемник (фотодиод, фоторезист и др. ) Из рис. 3.20.2 следует, что оптронная пара является своеобразным трансформатором напряжения, управляемого с помощью светового сигнала. Светодиод как излучатель и фотодиод как приемник закрепляются в один блок. Такой блок называется оптроном. Подчеркнем еще раз, различие между фотодиодом и светодиодом состоит в том, что у фотодиодов в процессе работы имеют место безизлучательные переходы неосновных носителей заряда, а у светодиодов имеют место излучательные переходы, когда в результате переходов квазиэлектронов из зоны проводимости в валентную излучается квант энергии электромагнитной волны. Что же касается различия между фотоэлементом и фотодиодом, то, помимо своего назначения, они еще различаются особенностями подключения к внешней электрической цепи, а также геометрическими размерами. А так как с помощью фотоэлементов, как правило, необходимо получить максимальную величину фототока, то освещаемая поверхность фотоэлемента должна быть достаточно велика. 3.21. Физические основы работы лазеров 3.21.1 Время жизни атома в возбужденном состоянии Ранее мы ввели в рассмотрение систему уровней полной энергии, которые соответствуют стационарным состояниям электрона в атоме. Это означало следующее. Представим себе атом как замкнутую систему не взаимодействующих с окружающей средой частиц. Тогда электрон атома на стационарном уровне в отсутствие внешних воз-
212
действий может находиться неограниченное время, при этом, двигаясь вокруг ядра, электрон не излучает электромагнитную энергию. Однако такой идеальной замкнутой системы в природе не существует. Вопервых, даже у простейшего из атомов – атома водорода – в основном состоянии уровень 1s оказывается несколько размытым. Это происходит из-за взаимодействия электрона с ядром в процессе движения относительно центра инерции атома. Величина такого размытия экспериментально наблюдается и называется лэмбовским сдвигом. Стало быть, строго говоря, в природе не существует дискретных, строго определенных уровней полной энергии. Во-вторых, возбужденный атом всегда находится во взаимодействии с окружающей средой, и это взаимодействие имеет случайный характер, в результате такого взаимодействия атом в какой-то момент времени самопроизвольно переходит в менее возбужденное состояние, излучая при этом в окружающее пространство квант электромагнитной энергии. Такое излучение, происходящее в отсутствии заметных электромагнитных воздействий со стороны окружающей среды, называется самопроизвольным, или спонтанным. Определим время жизни атома в возбужденном состоянии на примере двухуровневой системы полных энергий. Пусть электрон атома в момент времени t обладает энергией ε2. Тогда под действием случайных причин, механизм которых детально проследить невозможно, электрон самопроизвольно переходит в состояние ε1 < ε2 . Такой переход осуществляется с некоторой вероятностью ω.
ε ε2
N2 W21
ε1
N1
Рис. 3.21.1. Система двухуровневых атомов Обозначим вероятность спонтанного перехода за 1 с W21 , или, что то же самое, скорость спонтанного распада, буквой W21 (рис. 3.21.1). Если в веществе в момент времени t в состоянии ε2 находилось N2
213
атомов, то за время dt вероятность перехода в состояние ε1 будет dω = W21 dt . Вероятность спонтанного перехода атома, находящегося в возбужденном состоянии, за среднее время жизни τсп в возбужденном состоянии τ сп
∫ W21dt = 1.
(3.21.1)
0
Следовательно, среднее время жизни в возбужденном состоянии при спонтанных переходах (W21 = const) −1 τсп = ( W21 ) . За время dt в состояние ε1 перейдет dN2 атомов: dN 2 = − N 2 W21 dt , причем знак (-) указывает на убыль числа атомов на уровне ε2. Тогда после интегрирования получаем N 2 = N 20 e − W21 t , (3.21.2) где N20 – число атомов на уровне ε2 в начальный момент времени t=0. Каждый такой переход сопровождается излучением кванта электромагнитной энергии. Поэтому ε 2 − ε1 = h ν . Энергия электромагнитного излучения атомов dN2 за время dt будет dε = h ν W21 N 2 dt , а поток электромагнитной энергии, возникающий в результате таких переходов, с учетом (3.21.2) будет dε Φ= = h ν W21 N 2 , dt или Φ = Φ 0 e − W21 t . (3.21.3) Таким образом, поток электромагнитной энергии, возникающий в результате спонтанных переходов атомов из возбужденного в невозбужденное состояние, с течением времени убывает по экспоненте. Подставим найденной значение t = τсп в уравнение (3.21.3): Φ (τсп ) = Φ 0 e −1 . Это означает, что за время, равное средней продолжительности жизни атома в возбужденном состоянии на уровне ε2, поток квантов электромагнитного излучения уменьшается в e раз, следовательно, число атомов, находящихся в состоянии ε2, также уменьшает-
214
ся в e раз. Опыт показывает, что в видимой области спектра τсп ≈ 10-8 с, стало быть, W21 ≈ 108 c −1 . 3.21.2. Принцип детального равновесия В квантовой системе, обладающей дискретными уровнями энергии, существуют три типа переходов электронов между энергетическими состояниями: индуцированные электромагнитным полем переходы или, что тоже самое, вынужденные переходы, спонтанные переходы и безизлучательные переходы. При индуцированных переходах квантовая система может переходить из одного энергетического состояния в другое (рис. 1) как с поглощением энергии электромагнитного поля (переход с нижнего энергетического уровня на верхний), так и с излучением электромагнитной энергии (переход с верхнего энергетического уровня на нижний), при этом исходный квант сохраняется, а возникший квант имеет те же физические свойства, что и исходный.
ε ε2
n2
ω 21 ε1
ω12
W21 n1
Рис. 3.21.2. Переходы в двухуровневой системе: n1, n2 – населенности нижнего и верхнего уровней энергии; ω21 , ω12 – скорости индуцированных переходов (число переходов за 1 с ); W21 – вероятность спонтанного перехода за 1с. Индуцированные переходы обладают следующими важными свойствами. 1. Скорости индуцированных переходов ω21, ω12 отличны от нуля только для внешнего электромагнитного поля резонансной частоты. Следовательно, h ν = ε 2 − ε1 . 2. Возникающие при индуцированных переходах кванты электромагнитного поля полностью тождественны квантам поля, вызвавшего
215
эти переходы. Значит, внешнее электромагнитное поле и поле, возникшее в результате индуцированных переходов, имеют одинаковую частоту, фазу колебаний, поляризацию и направление распространения, т.е. они физически неразличимы, когерентны. 3. Число индуцированных переходов за 1 с пропорционально плотности энергии внешнего поля ρλ,T в единичном спектральном интервале длин волн: ω12 = g1 B12 ρλ , T , ω21 = g 2 B21 ρλ , T , (3.21.4) где В12, В21 – коэффициенты Эйнштейна для индуцированного поглощения и излучения; g1, g2 – кратность вырождения уровней ε1 и ε2 ; Φ λ,T ρλ , T = , V Фλ,T – спектральный поток электромагнитной энергии, V – объем вещества, в пределах которого распространяется этот поток. Благодаря наличию вынужденного излучения в веществе всегда происходит усиление первичного излучения без изменения его спектрального состава. Но, кроме индуцированного излучения, еще существует спонтанное излучение, вероятность которого не зависит от величины внешнего электромагнитного поля. Оно некогерентно по отношению к внешнему полю. Своим действием спонтанное излучение лишь опустошает верхний энергетический уровень и способствует возвращению атомов в менее возбужденное состояние. Предположим, что в объеме, заполненном излучением абсолютно черного тела, находится газ, концентрация молекул которого настолько мала, что взаимодействием между ними на расстоянии можно пренебречь. Распределение по энергиям молекул такого газа описывается статистикой Максвелла-Больцмана. Так как спонтанное излучение не зависит от плотности энергии излучения ρλ,T, то число спонтанных переходов W21 пропорционально числу атомов, находящихся на уровне ε2: N сп = W21 N 2 . Число индуцированных переходов зависит от числа атомов, соответственно находящихся в состояниях ε1 и ε2 . Тогда с учетом (3.21.4) можно записать: N инд1 = g1 B12 N1 ρλ , T , N инд 2 = g 2 B21 N 2 ρλ , T . В состоянии динамического равновесия имеет место равенство между числом актов испускания и числом актов поглощения квантов энергии. А так как уровни ε1 и ε2 выбраны произвольно, то говорят, что в объеме имеет место детальное равновесие для переходов между уровнями ε1 и ε2 . При наличии детального равновесия
216
N инд1 = N сп + N инд 2 , т. е.
g1 B12 N1 ρλ , T = W21 + g 2 B21 ρλ , T .
(3.21.5)
Отсюда −1
⎛ ⎞ N ρλ , T = W21 ⎜⎜ g1 B12 1 − g 2 B21 ⎟⎟ . N2 ⎝ ⎠ В стационарных условиях в веществе имеет место термодинамическое равновесие. Поэтому атомы N1 и N2 распределяются по энергетическим уровням в соответствии с распределением МаксвеллаБольцмана ⎛ hc ⎞ ⎟⎟. N1 = N 2 exp⎜⎜ ⎝ λkT ⎠ Тогда −1
hc ⎛ ⎞ ⎜ ⎟ λkT (3.21.6) ρ λ , T = W21 ⎜ g1 B12 e − g 2 B21 ⎟ . ⎜ ⎟ ⎝ ⎠ Как известно, плотность энергии равновесного излучения абсолютно черного тела
−1
⎛ hc ⎞ 8πhc ⎜ λkT ⎟ ρλ , T = 5 ⎜ e − 1⎟ . (3.21.7) λ ⎜ ⎟ ⎝ ⎠ Выражения (3.21.6) и (3.21.7) будут идентичны, если выполняются следующие соотношения Эйнштейна: W21 8 π h c g1B12 = g 2 B21 = B; = 5 . (3.21.8) B λ c c Так как по физическому смыслу B = 1 , W21 = 1 , то τинд τсп 8πhc τсп (3.21.9) λ5 Таким образом, время жизни атома при наличии индуцированного излучения зависит от длины волны, для коротких длин волн оно больше, чем для длинных. Вычисления τсп и τинд по формуле (3.21.9) для двух длин волн сведены в таблицу значений, причем τсп определялось по формуле: τсп = 4,7·104 λ2 , [λ] = м. τинд =
217
λ нм 400 800
τсп 7,5·10-9 3·10-8
τинд
τинд/τсп
0,37 0,046
4,9·107 1,5·106
с
Из таблицы видно, что время жизни атомов при индуцированных переходах во много раз превышает время жизни при спонтанных переходах. Поэтому состояния атомов, находящихся на уровнях, с которых происходят индуцированные переходы, считают метастабильными (долгоживущими). Итак, условию детального равновесия соответствует тождество (3.21.5), которое выполняется, когда на уровне ε1 находится N1 атомов, а на уровне ε2 находится N2 атомов. Если подобные рассуждения провести не для газа, а для твердого тела, в котором присутствует незначительная концентрация атомов примеси, то приближенно также можно применять распределение Максвелла-Больцмана для числа атомов на отдельных примесных уровнях полной энергии. Следовательно, и в этом случае будет справедливо тождество (3.21.5), а также все физические выводы, установленные ранее для газов. 3.21.3. Основные принципы работы лазеров Термин "лазер" образован из начальных букв английского выражения Light Amplification by Stimulated Emissin of Radiation, что в переводе означает "усиление света вынужденным излучением". В 1954 г. советским физикам Н.Г. Басову и А.М. Прохорову и независимо от них американцу Ч. Таунсу удалось создать такой источник электромагнитного излучения. Первый лазер действовал в радиодиапазоне, а первая генерация в оптическом диапазоне была получена в 1960 г. американскими физиками Т. Мейманом на рубине и А. Джаваном с сотрудниками в гелий-неоновой смеси. За пионерские работы по созданию лазера в 1964 г. Н.Г. Басову, А.М. Прохорову и Ч. Таунсу была присуждена Нобелевская премия по физике. Основными свойствами лазерного излучения, отличающими его от излучения других источников света, являются: 1) высокая когерентность; 2) возможность генерации импульсов предельно малой длительности ≈ 10-14 с; 3) высокая мощность излучения в импульсном режиме генерации, до 1014 Вт. Лазеры различаются:
218
1) по типу активной среды – газовые (атомные, ионные, молекулярные), твердотельные (на примесных кристаллах и стеклах, полупроводниковые), жидкостные; 2) по режиму генерации – непрерывные, импульсные. Из всех перечисленных выше типов лазеров мы более подробно рассмотрим принцип работы только газового гелий-неонового и полупроводникового лазеров. Газовые лазеры работают в очень широком интервале длин волн – от вакуумного ультрафиолета до инфракрасной области спектра, как в импульсном, так и в непрерывном режимах. Малая плотность и высокая однородность газообразной активной среды позволяет получить высокую направленность и моноэнергетичность излучения. Вместе с тем малая плотность возбужденных частиц не позволяет получить высокую концентрацию возбуждаемых частиц. Для создания инверсной населенности отдельных уровней полной энергии в подавляющем большинстве газовых лазеров используется электрический разряд, в процессе которого электроны разряда возбуждают атомы газа, введенного в рабочий объем в качестве примеси к атомам основного газа. Далее передача энергии возбуждения от атомов примеси атомам основного газа осуществляется в результате неупругих столкновений между ними. Такая передача энергии тем более эффективна, чем более точно совпадают уровни полной энергии сталкивающихся между собой атомов. Процесс возбуждения протекает в два этапа. Сначала возбуждаются атомы вспомогательного газа, носители избыточной энергии и вместе с тем являющиеся донором энергии возбуждения, затем в результате неупругих столкновений атомов примеси с атомами основного газа энергия возбуждения передается атомам рабочего газа. В результате верхние уровни полной энергии населяются электронами атомов рабочего газа, при этом электрон атома вспомогательного газа на верхнем уровне должен обладать достаточно большим временем жизни, чтобы атомы примеси могли бы накапливать достаточно большую совокупную энергию для последующей передачи ее в процессе неупругих столкновений. 3.21.4. Гелий-неоновый лазер В He-Ne лазере рабочей средой является смесь газов He и Ne, причем рабочим газом является Ne, а примесью – газ He. В объем атомы He вводятся для создания инверсной населенности. При правильно выбранных давлениях можно добиться заселения одного или обоих
219
уровней атомов Ne в смеси газов, значительно превышающих заселение атомов в случае чистого Ne, и, следовательно, создать инверсию населенности на этих уровнях по сравнению с населенностью на уровне ε3 (см. рис. 3.21.3). Заметим, на рис. 3.21.3 представлена лишь упрощенная схема уровней полных энергий атомов Ne. На самом деле каждое энергетическое состояние ε2 – ε2 состоит из нескольких близко расположенных состояний, условно они изображены в виде зоны энергий. Опустошение нижних уровней ε2 происходит в столкновительных процессах как между атомами Ne, так и при столкновениях атомов Ne с поверхностью газоразрядной трубки. Столкновительные процессы происходят следующим образом (см. рис. 3.21.3). ε
ε 3′
ε6 ε5
ε 2′
ε4
λ1 λ2
λ3
ε3
ε2 ε1′ He
ε1
Ne
Рис. 3.21.3. Схема действия He-Ne лазера Уровни ε2 , ε4 , ε6 – метастабильные; переход из состояния ε2 в состояние ε1 возникает в результате столкновений между атомами Ne, а также столкновений атомов Ne со стенкой газоразрядной трубки (безизлучательный переход); λ1 = 3,39 мкм, λ2 = 0,6328 мкм, λ3 = 1,15 мкм – длины волн индуцированного (вынужденного) излучения. В процессе столкновений атомов Не со свободными электронами атомы He переходят из основного состояния ε1′ в возбужденные состояния ε2′ и ε3′ , соответствующие метастабильным уровням энергии со временем жизни ≈ 10-3 с. Верхние уровни атомов Ne при столкновениях со свободными электронами также заселяются электронами, но время жизни на них
220
невелико. Поэтому за время порядка 10-8 с в обратном направлении происходит спонтанный переход. Наряду с этим, при столкновениях атомов Не с невозбужденными атомами Ne интенсивно происходят безизлучательные переходы атомов Не в невозбужденное состояние с резонансной передачей энергии атомам Ne. Этот процесс на рис. 3.21.3 условно изображен пунктирными линиями. В результате концентрация возбужденных атомов Ne на уровнях ε4 и ε6 сильно возрастает, возникает инверсная заселенность уровней ε4 и ε6 относительно заселенности уровней ε3 и ε5. Если в объеме, допустим, возникнет квант вынужденного излучения, то при столкновении с инверсно заселенным атомом Ne в объеме возникнет новый квант излучения, тождественный первоначальному. В результате в объеме будут существовать два кванта излучения, и т.д. Таким образом, в объеме будет происходить лавинообразное нарастание квантов. Но в веществе наряду с увеличением числа квантов всегда происходят необратимые потери энергии излучения в результате их резонансного поглощения атомами рабочего вещества, поглощения материалом стенки газоразрядной трубки. Пусть α – коэффициент квантового усиления, β – коэффициент потерь, тогда величина набольшего потока энергии на выходе резонатора можно вычислить по формуле: Φ = Φ 0 exp((α − β) ⋅ λ), где ℓ – расстояние между зеркалами резонатора. Опустошение верхних уровней Ne ε3, ε5 происходит за счет спонтанного излучения. Опустошение нижнего метастабильного уровня Ne ε2 происходит за счет соударений атомов Ne со стенками газоразрядной трубки. Возбуждение атомов He и Ne осуществляется либо высокочастотным генератором, либо разрядным током, возникающим в объеме газоразрядной трубки при разности потенциалов между анодом и катодом порядка 1–2 кВ. При газовом разряде частота, фаза и направление колебаний векρ тора E в электромагнитной волне распределены хаотически, также хаотически в различных направлениях распространяется и электромагнитная волна. Поэтому для усиления интенсивности лазерного излучения применяют резонаторы – устройства, с помощью которого выделяют и усиливают излучение только одного направления и фазы. Простейший резонатор представляет собой два зеркала с общей оптической осью, в котором между зеркалами находится активное вещество, в данном случае смесь газов Ne и Не. Одно зеркало имеет почти 100%-ный коэффициент отражения, другое – примерно 99%. В такой системе зеркал будут усили-
221
ваются только те потоки электромагнитных волн, которые распространяются строго вдоль оптической оси. Усиление происходит в результате многократного прохождения квантов индуцированного излучения через активную среду после отражения от зеркал, но на каждом акте отражения от зеркала с коэффициентом отражения порядка 99% некоторый поток излучения выходит за пределы резонатора. Поэтому, если случайно возникший пучок индуцированного излучения составляет с оптической осью даже незначительный угол, то после отражения он уже выбывает из активной среды. В результате за пределы резонатора выходит монохроматическое излучение, обладающее строгой направленностью и когерентностью. В настоящее время наибольшее распространение получила конструкция лазера, у которого газоразрядная трубка имеет окна, расположенные под углом Брюстера к оптической оси. Она помещается внутрь резонатора. Это позволяет исключить повреждение поверхности зеркал резонатора газовым разрядом. Кроме того, при таком расположении проще юстировать зеркала резонатора, увеличивается срок службы газоразрядной трубки и зеркал, облегчается смена зеркал. Минимальная расходимость лучей в пучке достигает 5⋅10-4 рад. Когерентность в лазерном пучке позволяет получать цуги волн длиною в десятки и сотни метров, что позволяет значительно увеличить вероятность индуцированного излучения. На рис. 3.21.3 указаны длины волн, соответствующие вынужденным (индуцированным) излучениям. Изменением расстояния между зеркалами резонатора до величины, кратной половине длины волны индуцированного излучения, можно выделить излучение необходимой длины волны. Несмотря на не очень большую мощность (от 1 мВт до 50 мВт) и низкий коэффициент полезного действия (от 0,1% до 0,3%), He-Ne лазеры вследствие хорошей направленности и монохроматичности лазерного луча нашли достаточно широкое применение. 3.21.5. Полупроводниковые лазеры Ранее мы показали, что полупроводниками являются не только кристаллические Si и Ge (собственные полупроводники), но и те же кристаллические вещества с внедренными в их кристаллическую решетку атомами примесей из соседних групп периодической системы Менделеева. Так, полупроводники на основе Si с примесью атомов Р, As можно условно обозначить как полупроводники группы А4В5, а с примесью атомов Ga, In – как полупроводники группы А3В4. В настоящее время установлено, что полупроводниковыми свойствами
222
обладают полупроводники групп А3В5, такие как AsGa, AsIn и другие, а также групп А4В6, такие как SPb, SePb и другие. В инжекционных полупроводниковых лазерах активным веществом служит кристаллическая матрица собственного полупроводника, а примеси являются источником носителей заряда. При создании в полупроводнике с помощью накачки избыточной по сравнению с равновесной концентрации квазиэлектронов и дырок возникает оптический межзонный переход – фоторекомбинация квазиэлектронов и дырок. Оказывается, что вероятность фоторекомбинации велика лишь для прямозонных полупроводников, т.е. таких, у которых максимум полной энергии в валентной зоне и минимум полной энергии в зоне проводимости основных носителей заряда соответствуют одному и тому 2π , k – величина волнового же значению квазиимпульса p = η k , k = λ вектора (волновое число). По этой причине все инжекционные полупроводники, на которых получена генерация лазерного излучения, являются прямозонными. Перечислим важнейшие достоинства инжекционных полупроводниковых лазеров. 1. Большой коэффициент усиления при малых геометрических размерах. 2. Большой КПД, доходящий до 40%. 3. Широкий интервал длин волн, в котором возможна генерация лазерного излучения (от 300 нм до 30 мкм). 4. Возможность перестройки длины волны генерации путем изменения ширины запрещенной зоны в результате изменения давления, температуры, магнитного поля. 5. Малая инерционность, позволяющая модулировать излучение изменением частоты накачки до 10 ГГц. 6. Простота конструкции, поскольку процесс инверсии населенности осуществляется постоянным током. Недостатками инжекционных полупроводниковых лазеров являются: 1. низкая выходная мощность, 2. значительная чувствительность к перегрузкам. Для создания инверсной населенности в основном применяют либо инжекцию носителей заряда, либо электронную накачку. Резонаторами обычно служат параллельно расположенные кристаллографические плоскости на поверхностях полупроводника. В этом случае коэффициент отражения от таких кристаллографических плоскостей
223
оказывается достаточным для возбуждения генерации лазерного излучения без использования дополнительных зеркал. На рис. 3.21.4, а изображены соответственно графики нижней и верхней границ зон проводимости и валентной для прямозонного полупроводника, а на рис. 3.21.4, б изображены те же графики для полупроводников А3В5, А4В6, например, соответственно для AsGa и SPb. Так как элементарные полупроводники А3В5 или А4В6 не являются прямозонными, то они и не применяются в инжекционных полупроводниковых лазерах. ε
ε
k
а
k
б
Рис. 3.21.4. Энергетические зоны в полупроводниковых лазерах: ε – полная энергия носителей заряда, k – волновое число. При переходе электрона из зоны проводимости в валентную выполняется закон сохранения импульса: ρ ρ ρ pe1 = pe 2 + pф , ρ ρ где pe1 , pe 2 – импульсы электрона соответственно в зоне проводимоρ сти и в валентной зоне, pф – импульс фотона. Так как импульс фотона значительно меньше импульса электрона в валентной зоне, то переходы, связанные с излучением фотона, можно изобразить в виде вертикальной линии. В случае же Si и Ge места на графике ε(k), занятые квазиэлектроном и дыркой, сдвинуты относительно друг друга на некоторую величину ∆k (рис. 3.21.4, б). В этом случае возможен только непрямой переход, при котором изменение импульса электрона компенсируется кристаллической решеткой. Это означает, что добавочное изменение импульса принимает на себя фонон кристаллической решетки. Следовательно, такие переходы являются безизлучательными. Итак, переход из зоны проводимости в валентную у прямозонных полупроводников сопровождается испусканием кванта электромаг-
224
нитной энергии, а обратный процесс возможен только при резонансном поглощении квантов. Поэтому, чтобы излучение преобладало над поглощением, необходимо создать инверсную населенность. Идеальный случай инверсной населенности возникает, если верхний край валентной зоны оказывается полностью занятым дырками. Тогда вероятность перехода с излучением кванта энергии будет достаточно велика. В случае же непрямозонного полупроводника носители заряда накапливаются в состояниях с различными значениями квазиимпульса, различными значениями волнового числа. В результате прямые переходы оказываются запрещенными или маловероятными, и рекомбинации квазичастиц не возникает. Соединения А3В5 образуются в результате взаимодействия атомов 3 В группы периодической таблицы Менделеева (B, Al, Ga, Ta) с атомами В5 группы (N, P, As, Sb). Tl и Bi не образуют соединений рассматриваемого ряда. Соединения А3 В5 принято классифицировать по металлоидному элементу, а именно, N (нитриды), P (фосфиды), As (арсениды), Sb (антимониды). Для соединений А3 В5 характерен донорно-акцепторный тип связи, при котором из четырех ковалентных связей три связи образуются в результате обобществления валентных электронов атомов А3 и В5 , а четвертая связь осуществляется двумя валентными электронами атомов В5. Образование этой связи соответствует энергетически выгодному переходу электронов от атомов В5 в энергетическое состояние, общее для атомов В5 (доноры) и атомов А3 (акцепторы). В каждой ковалентной связи максимум электронной плотности смещен в сторону атома В5. Благодаря такой поляризации связей атомы А3 приобретают эффективный положительный заряд, а атомы В5 – отрицательный. За исключением антимонидов, все соединения A 3 B 5 при нагревании разлагаются по схеме: 1 A 3 B 5 → A 3 (жидкость) + B 52 (газ). 2 Примеси замещения в кристаллической решетке А3 В5 должны быть распределены таким образом, чтобы в ней не возникало бы центров с большим избыточным зарядом. Поэтому примеси II группы (Be, Mg, Zn, Cd) всегда занимают в кристаллической решетке А3 В5 узлы металлического компонента и являются акцепторами благодаря меньшей валентности по сравнению с замещаемыми атомами. Приме-
225
си VI группы (S, Se, Te) всегда располагаются в узлах кристаллической решетки, замещая В5 , и являются донорами. Ценным свойством многих полупроводников типа А3 В5 является высокая эффективность излучения рекомбинации неравновесных носителей заряда. Для генерации излучения в видимой области спектра ширина запрещенной зоны должна быть больше 1,7 эВ. Такому условию удовлетворяют GaP и GaN. Материалы с более узкой запрещенной зоной способны эффективно излучать в инфракрасной области спектра. К их числу относится GaAs с шириной запрещенной зоны 1,43 эВ. Излучение фотонов в GaAs происходит в результате прямой межзонной рекомбинации электронов и дырок. При легировании GaN атомами Zn в зависимости от концентрации примесей Zn можно получить рекомбинационное излучение в видимой области спектра (желтое, зеленое, голубое излучение). Первый инжекционный полупроводниковый лазер был создан в 1962 году. В нем генерация когерентного излучения возникала в кристалле арсенида галлия GaAs. Но лазерный эффект проявляется здесь в том случае, если плотность тока через p-n переход превышает некоторое пороговое значение, в противном случае это устройство будет работать в режиме светодиода. Известно, что кристалл GaAs представляет собой твердый раствор, образованный атомами Ga и As. Поскольку понятие твердого раствора в общем курсе физики не объясняется, то приведем некоторые основные сведения о типах и физическом строении твердых растворов. Твердые растворы – это твердые фазы сплавов, в которых соотношения между концентрациями компонентов могут быть изменены без нарушения однородности вещества. В природе существуют три основных типа твердых растворов: замещения, внедрения, вычитания. В твердых растворах замещения атомы растворенных компонентов замещают атомы растворителя. Если же твердый раствор – химическое соединение, то реализуется схема, когда кристаллическая решетка образуется молекулами АВ. В твердых растворах внедрения атомы растворенного компонента располагаются в промежутках между атомами решетки растворителя. Твердый раствор вычитания возникает только на основе химических соединений, причем в этом случае всегда некоторое число узлов кристаллической решетки оказывается вакантным. В настоящее время твердые растворы широко используются для изготовления инжекционных полупроводниковых приборов. Необходимыми условиями образования таких растворов являются кристаллохимическое подобие решеток компонентов раствора и близость их
226
кристаллографических индексов. Наиболее хорошо изучены тройные твердые растворы, в которых замещение происходит лишь по узлам одной из подрешеток металлического или металлоидного бинарного соединения. Заметим, что под словом "подрешетка" понимается система периодически расположенных в твердом теле одинаковых атомов или ионов, а под словами "бинарное соединение" – соединения типа АВ, например, GaAs или InP, т.е. соединения без примесных атомов. Состав таких твердых растворов принято характеризовать символами АxВ1-xС и АСyD1-y, где символами А и В обозначаются элементы III группы, а символами С и D – элементы V группы. В формуле Аx В1-xС индексом x определяют мольную долю соединения АВ в твердом растворе. Если твердые растворы существуют во всем интервале изменения концентраций, то x может меняться от 0 до 1. Как и в бинарных соединениях типа А3 В5, в твердых растворах не наблюдается существенных отклонений от стехиометрии, поэтому они просты по механизму легирования, т.е. у них теми же методами, что и в бинарных соединениях, может быть получен p-n переход. Особый интерес к твердым растворам, в частности, обусловлен возможностью плавного управления шириной запрещенной зоны полупроводника путем изменения их компонентного состава. Так, зависимость ширины запрещенной зоны от состава твердых растворов GaxIn1-xAs или InPyAs1-y очень близка к линейной, что весьма удобно при изготовлении полупроводников с заданными спектральными характеристиками. По мере развития технологии полупроводниковых материалов появилась возможность создания в полупроводнике неоднородность состава. Переходный слой между двумя полупроводниками с разным составом называют гетеропереходом. В гетеропереходах потенциальные барьеры для электронов и дырок отличаются друг от друга по величине, у этих полупроводников различна ширина запрещенной зоны. При наличии внешней разности потенциалов протекающий через границу раздела электрический ток создается носителями заряда только одного знака, например, квазиэлектронами. Для получения гетероперехода со свойствами идеального контакта необходимо выполнить ряд условий совместимости материалов по механическим, кристаллографическим и термическим свойствам. Решающим критерием при выборе материалов контактной пары является соответствие постоянных кристаллических решеток и температурных коэффициентов расширения. Среди полупроводников типа А3 В5 лучшими парами материалов для создания идеальных гетероперехо-
227
дов являются GaAs – Alx Ga1-x As и GaSb – Alx Ga1-x Sb. Преимущества этих гетеропар состоят в том, что величина постоянной кристаллической решетки твердых растворов как у Alx Ga1-x As, так и у Alx Ga1-x Sb слабо зависит от состава и близка к постоянной кристаллической решетки бинарного соединения как GaAs, так и GaSb соответственно. hν
6
p
p
p
n
n
1
2
3
4
5
h2
h3 U + −
6
h4
ε
0
з. п. eU в. з.
Рис. 3.21.5. Лазер с двойной гетероструктурой на GaAs – Alx Ga1-x As: 1. n-GaAs; 2. p-Alx Ga1-x As; 3. p-GaAs; 4. n-Alx Ga1-x As; 5. n-GaAs; 6. омические (электрические) контакты; 0,2 мкм ≤ h3 ≤ 1 мкм ; h2 = h4 = 1 мкм На рис. 3.21.5 приведена схема инжекционного лазера с двойной гетероструктурой. Область рекомбинации и электромагнитного излучения сосредоточена в узкозонном активном слое p-GaAs, заключенном между двумя широкозонными эмиттерами Alx Ga1-x As. При прямой внешней разности потенциалов в такой структуре имеет место инжекция носителей заряда в активный слой. В результате удается достигнуть очень высокого квантового выхода и существенно снизить пороговую мощность тока, необходимую для генерации когерентного излучения. Снижение порогового тока позволяет осуществить непрерывный режим генерации даже при комнатной температуре, которую не удается реализовать в лазерах на гомогенных структурах с p-n переходом. Так как толщина переходного слоя, в котором генерируется лазерное излучение, достаточно мала, то мощность лазерного излучения всегда оказывается незначительной. Так, выходная мощность инжекционного полупроводникового лазера на гетеропереходах в режиме непрерывной генерации при комнатной температуре не превышает 100 мВт.
228
Рис. 3.21.6. Схематический вид конструкции полупроводникового инжекционного лазера Конструкция инжекционного лазера следующая. Кристаллу полупроводника с линейными размерами порядка десятых долей мм придают форму усеченной четырехгранной пирамиды (рис. 3.21.6). Две боковые грани строго параллельны, их поверхности отполированы, и поэтому они представляют собой оптический резонатор. Для исключения оптического резонанса между двумя другими гранями их скашивают под углом к основанию. Основные области применения: 1. передача информации на большие расстояния; 2. измерение расстояний, линейных и угловых скоростей, деформации поверхности и т.д. на основе использования интерференции лазерного излучения; 3. использование в качестве стандарта частоты; 4. изготовление логических элементов высокого быстродействия с временем быстродействия до 10-10 с для сверхбыстродействующих ЭВМ. Первые патенты на гетеропереходы были получены В. Шокли и Г. Кремером (оба из США), которые исследовали гетеропереходы теоретически. В начале шестидесятых годов в Физико-техническом институте (г. Ленинград) была выпущена монография Н.Н. Губанова по теории гетеропереходов. Тогда многие полагали, что физика гетеропереходов остается на уровне идей, что реализовать гетеропереходы не удастся, потому что на границе двух полупроводников с разным составом будет сильно искажаться кристаллическая решетка, будут накапливаться примеси, не будет одностороннего протекания носителей заряда через гетеропереход. Тем не менее, Ж.И. Алферов в Ленинградском ФТИ начал исследование гетеропереходов системы GaAs– GaAlAs. Оказалось, что в этой системе полупроводников в переходном
229
слое возникает очень мало искажений кристаллической решетки, которые сильно влияют на эффективность работы приборов. На основе работ группы Ж.И. Алферова были созданы полупроводниковые лазеры, работающие при комнатной температуре в режиме постоянного тока, сначала в инфракрасном, а затем в видимом диапазонах длин волн. В этих полупроводниках при рекомбинации возбужденных электронно-дырочных пар энергия возбуждения передается в основном квантам света, т.е. происходит излучательная рекомбинация. Поэтому развитие физики и технологии гетеропереходов оказалось наиболее важным для приборов оптоэлектроники – для светодиодов, полупроводниковых лазеров и фотоприемников. В начале семидесятых годов ФТИ направил Ж.И. Алферова на стажировку в США в лабораторию профессора Ника Холоньяка. Н. Холоньяк происходил из семьи, эмигрировавшей в Америку из Украины в двадцатых годах, хорошо знал русский язык и был знаком с работами Ж.И. Алферова по гетеропереходам. В это время ученые из фирмы "Белл" также сделали гетеропереходы на основе арсенида галлия, и их работы были представлены на золотую медаль Американского физического общества. Заявка попала на отзыв Н. Холоньяка, который в своем отзыве написал, что такие переходы на 2–3 года раньше были сделаны Ж.И. Алферовым. В результате золотая медаль Американского физического общества была присуждена Ж.И. Алферову. В декабре 2000 г. за разработку и практическое использование гетеропереходов академику Ж.И. Алферову вместе с двумя американскими учеными Г. Кремером и Дж. Килби была присуждена Нобелевская премия по физике, причем Г. Кремеру – за теоретические исследования в области гетеропереходов, а Дж. Килби – за разработку методики и технологии микросхем с гетеропереходом на одной пластине, которая называется "чипом". 3.22. Эмиссионные явления
В зависимости от особенностей внешних физических воздействий различают следующие виды эмиссии заряженных частиц с поверхности твердого тела: термоэлектронная, термоионная, фотоэлектронная, вторичная электронная, вторичная ионная, полевая (туннельная). Во всех видах эмиссий, кроме полевой, роль внешних воздействий сводится к увеличению энергии у некоторого числа электронов или ионов твердого тела до значения, позволяющего преодолеть действие сил,
230
которое связывает их с телом, и вылететь в вакуум или в другую среду, т. е. преодолеть существующий на границе раздела двух сред потенциальный барьер. Для наблюдения и использования электронной эмиссии необходимо создать у поверхности эмиттера электрическое поле, удаляющее от вещества эмиттированные частицы. В случае полевой эмиссии внешнее электрическое поле на границе твердого тела создает потенциальный барьер конечной толщины, благодаря чему оказывается возможным преодоление барьера туннельным эффектом. Однако для возникновения полевой эмиссии необходимо вблизи поверхности твердого тела создать сильное электрическое поле напряженностью порядка 107 В/см, в этом случае плотность тока может достигать величины порядка 107 А/см2. В импульсных электрических полях еще большей величины отдельные участки эмиттера (выступы, заострения) сильно разогреваются и взрываются, в результате часть вещества эмиттера из конденсированной фазы непосредственно переходит в плотную плазму. Такой процесс сопровождается испусканием интенсивного электронного потока – возникает взрывная электронная эмиссия. Важнейшей эмиссионой характеристикой твердого тела является работа выхода, равная минимальной энергии, которая необходима для перемещения электрона с поверхности Ферми (с уровня Ферми) в твердом теле в вакуум, т.е. в ту точку пространства, где напряженность электрического поля практически равна нулю. Согласно современным представлениям, в поверхностный потенциальный барьер, на преодоление которого и совершается работа выхода, основной вклад вносят обменные и корреляционные эффекты, а также, в меньшей степени, электрический двойной слой, существующий у поверхности твердого тела. 3.22.1. Термоэлектронная эмиссия из металлов Опыт показывает, что все твердые тела при достаточно высокой температуре испускают электроны, число которых быстро возрастает с температурой. Это явление называется термоэлектронной эмиссией. Рассмотрим более подробно физические основы термоэлектронной эмиссии на примере металлов. Известно, что в металлах при любой температуре всегда имеются свободные электроны с кинетической энергией, превышающей величину потенциального барьера на границе металл–-вакуум. Чем выше температура металла, тем больше будет в металле электронов проводимости с кинетической энергией, достаточной для преодоления потенциального барьера на границе металл–
231
вакуум, тем интенсивней будет происходить эмиссия электронов (термоэлектронная эмиссия). В результате вблизи поверхности металла возникает электронное облако, в котором вследствие малой концентрации свободные электроны обладают свойствами частиц идеального газа. А так как этот газ описывается статистикой Ферми– Дирака, то он называется электронным Ферми-газом (ЭФГ). В отсутствие вблизи поверхности ускоряющего электрического поля между свободными электронами металла и электронами ЭФГ существует динамическое равновесие, согласно которому число вылетающих из металла электронов равно числу проникающих в металл электронов ЭФГ. Наличие ускоряющего внешнего электрического поля приводит к некоторому увеличению потока электронов из металла. Но так как число свободных электронов в металле очень велико, то уменьшение их числа практически не сказывается на концентрации свободных электронов в металле. Если же электрическая цепь при этом замкнута, то убыль числа электронов из металла пополняется из соседних участков цепи. Поэтому полное число свободных электронов, а также их концентрация все время останутся неизменными. ε
ρ v
ε2
ρ E
ε x
ε1 εф
x
ρ v
εф λ
dn dε
dn dε
0
0
а
б
Рис.3.22.1. Потенциальная энергия электронов вблизи поверхности На рис. 3.22.1, а схематически изображена зона проводимости, уровни полной энергии в отсутствие действия внешнего электрического поля, а также распределение квазиэлектронов по энергиям в зоне проводимости. На рис. 3.22.1, б показано изменение потенциальной энергии вблизи поверхности металла при наличии ускоряющего для
232
ρ
электронов напряженности электрического поля E . В этом случае вблизи поверхности металла возникает потенциальный барьер, который для различных энергий имеет различную толщину. Для простоты дальнейших рассуждений предполагается, что потенциальная яма прямоугольная. На рис. 3.22.1, а указаны возможные переходы свободных электронов с уровня Ферми на один из свободных уровней полной энергии: в первом случае переход происходит в пределах металла, ему соответствует энергия ε1, во втором случае переход сопровождается вылетом электрона с поверхности металла – ему соответствует энергия ε2 . Как следует из рис. 3.22.1, наибольшая концентрация электронов n имеет место вблизи уровня εф. Поэтому в наибольшем количестве поверхность металла будут покидать электроны с уровня εф. Следовательно, условие вылета электронов из металла должно определяться неравенством ε 2 − µ ≥ A, (3.22.1) где A – работа выхода электрона из металла, µ – химический потенциал. Согласно квантовой статистике, распределение квазиэлектронов по энергиям в металле и ЭФГ имеет вид −1
⎛ ε −µ ⎞ dn ⎟ ⎜ kT e = + 1⎟ , (3.22.2) ⎜ 3 dε h ⎟ ⎜ ⎠ ⎝ где m – эффективная масса электрона (квазиэлектрона), она принимается здесь постоянной; h – постоянная Планка; k – постоянная Больцмана. Практически у всех металлов температура плавления меньше 4000 К, поэтому у твердых тел температура всегда меньше 4000 К, kT ≤ 0,25 эВ. Так как химический потенциал µ порядка единиц эВ, ε > µ , то ε - µ > kT. Тогда для электронов ЭФГ металла можно записать: 3 4π(2m)2
3
µ
ε
dn 4 π ( 2 m ) 2 k Te 12 − k Te = e ε e , (3.22.3) dε h3 причем здесь Те – термодинамическая температура ЭФГ. Из условия экстремума функции (3.22.3) можно определить величину наиболее вероятной энергии εн.в, т.е. той энергии, которая соответствует наибольшей концентрации электронов в объеме ЭФГ:
233
⎛ 1 ε 0н..в5. ⎞⎟ ⎜ − e ⎜ 2 ε 0.5 k T ⎟ e . . н в ⎝ ⎠
ε − н.в . k Te
= 0.
Отсюда k Te . 2 С другой стороны, при выполнении неравенства ε - µ > kT функцию Ферми-Дирака можно представить в виде произведения двух множителей: ε н.в. =
−1
µ ε ⎛ ε −µ ⎞ − ⎟ ⎜ kT kT kT fф = ⎜ e . + 1⎟ = e e ⎟ ⎜ ⎠ ⎝ Из полученного выражения следует, что в принятом приближении эта функция достаточно хорошо соответствует распределению Максвелла-Больцмана. Так как полная энергия электрона в выбранной системе отсчета mv 2 , ε= 2 то dε = mv dv . После подстановки найденных значений энергии в (3.22.3) получаем: m v2
3
dn 4 π ( 2 m ) 2 32 2 − 2 k Te = (3.22.4) m v e . 1 dv 3 2 2 h По определению, функция распределения частиц по скоростям имеет вид: dn f (v ) = , (3.22.5) n dv где dn – концентрация частиц идеального газа в интервале скоростей от v до v+dv. Тогда в ЭФГ функция распределения электронов по скоростям будет: 2
f эфг = f 0e v e
−
m v2 2 k Te
где µ
f 0e
8 π m3 k Te = e , n h3
,
(3.22.6)
234
тогда как распределение молекул идеального газа по скоростям (распределение Максвелла) имеет вид:
2
f м = f 0 мv e
−
m v2 2kT
,
(3.22.7)
где 3
⎛ m ⎞2 ⎟⎟ . f 0 м = 4 π⎜⎜ ⎝ 2πkT ⎠ Сравнивая между собой формулы (3.22.6) и (3.22.7), мы видим, что с точностью до постоянных множителей они совпадают, следовательно, электроны объемного заряда вблизи поверхности металла обладают свойствами идеального газа, их распределение по скоростям совпадает с распределением Максвелла. При достаточно высокой температуре вблизи поверхности металла всегда существует электронное облако отрицательного заряда. Однако если вблизи поверхности возникает ускоряющее для электронов электрическое поле, то с его возрастанием объемный заряд постепенно будет рассасываться. Моменту исчезновения объемного заряда будет соответствовать ток насыщения, величина которого слабо зависит от величины ускоряющей напряженности электрического поля и сильно зависит от температуры катода. Зависимость тока насыщения от температуры хорошо описывается формулой Ричардсона–Дэшмана: 2
Ia = S BT e
−
A kT
,
(3.22.8)
где B = D B0 , B0 = 4 π k 2e m h −3 , B0 = 1,2 ⋅ 10−6 А ⋅ ( мк ) −2 , D = 1 - r, D – коэффициент прозрачности потенциального барьера на границе металл–вакуум; r – коэффициент отражения электронов от потенциального барьера; В0 – эмиссионная постоянная; S – площадь поверхности того участка металла, с которого измеряется ток насыщения. На рис. 3.22.2 приводится график зависимости анодного тока от величины ускоряющей разности потенциалов, на котором можно выделить три физически различных участка: 0 ≤ Ua ≤ U1 – интервал значений Ua, в котором вблизи поверхности металла существует объемный заряд с постоянной концентрацией
235
электронов, в этом и только в этом интервале значений Ua выполняется закон 3/2; на графике Ia = f(Ua) U1 соответствует точке перегиба; U2 ≥Ua ≥U1 – интервал значений Ua, в котором концентрация объемного заряда постепенно уменьшается; Ua > U2 – в этом интервале значений Ua объемный заряд вообще отсутствует, этот интервал соответствует режиму насыщения. Ia
U U 0 1 2 Рис. 3.22.2. Вольтамперная характеристика катода
U
a
Внешнее электрическое поле, проникая в металл, понижает высоту потенциального барьера на границе металл–вакуум, в результате на границе раздела возникает потенциальный барьер конечной толщины. Поэтому всегда существует определенная вероятность свободным электронам металла туннельным эффектом преодолеть возникший потенциальный барьер. Из квантовой механики известно следующее выражение для коэффициента прозрачности потенциального барьера конечной толщины: ⎛a ⎞ 4⎜⎜ 2 ⎟⎟ ⎝ a1 ⎠
D= ⎛a ⎞ 4⎜⎜ 2 ⎟⎟ ⎝ a1 ⎠
2
2
2
⎛ ⎛ a ⎞2 ⎞ + ⎜ ⎜⎜ 2 ⎟⎟ − 1⎟ sh 2 (a2 λ) ⎜ a1 ⎟ ⎝⎝ ⎠ ⎠
(3.22.9)
,
где 2
⎛ a2 ⎞ U 2m 2m ⎜⎜ ⎟⎟ = − 1 , = 2 (U − ε) , a12 = 2 ε , ε η η ⎝ a1 ⎠ m – масса электрона, U – потенциальная энергия электрона в металле, в первом приближении ее график совпадает с дном потенциальной ямы, ε – полная энергия электрона на границе металл-вакуум. a22
236
Пусть ℓ – толщина потенциального барьера на уровне Ферми. Тогда, если отсчет энергии вести от дна потенциальной ямы, то εф=µ , µ – химический потенциал. Тогда U = A + µ, А – работа выхода электрона из металла. Из квантовой статистики следует, что химический потенциал ЭФГ с большой точностью можно вычислить по формуле: 2
η2 ⎛ 3 n ⎞ 3 µ= (3.22.10) ⎜ ⎟ , 8m ⎝ π ⎠ n – концентрация электронов в ЭФГ. Таким образом, используя экспериментальные значения тока насыщения при различных температурах T и Ua, можно вычислить величину коэффициента прозрачности потенциального барьера для различных значений полной энергии, а также толщину потенциального барьера, что другими методами определить достаточно сложно.
3.22.2. Полевая электронная эмиссия Полевая (туннельная, автоэлектронная) эмиссия возникает в результате испускания твердыми телами электронов под действием сильного электрического поля у поверхности. Если внешнее электрическое поле достаточно велико для того, чтобы потенциальный порог на границе тела превратился в потенциальный барьер малой толщины, то становится возможным квантовомеханическое туннелирование электронов и выход их в вакуум. При этом электроны непосредственно после прохождения сквозь барьер имеют ту же энергию, что и внутри тела. Токи полевой эмиссии с большой плотностью удается получать с эмиттеров, имеющих форму острия. Предельная плотность тока, еще не разрушающего острия, возрастает с увеличением угла при вершине эмитирующего конуса, так как с увеличением этого угла улучшается отвод теплоты от острия. В очень сильных электрических полях, когда плотность тока полевой эмиссии достигает величины (1012–1013) А/м2, локальные участки на поверхности острия, из которых происходит эмиссия, из-за сильного разогрева взрываются, образуя плотную плазму, расширяющуюся со скоростью порядка 104 м/с. Этот процесс сопровождается возникновением интенсивной электронной эмиссии и называется взрывной электронной эмиссией. Взрывная эмиссия впервые была обнаружена при исследовании вакуумного пробоя в наносекундном диапазоне длительностей импульсов высокого напряжения, а также в экспериментах по автоэлектронной
237
эмиссии при предельно высоких плотностях тока в микросекундном диапазоне. Открытие взрывной эмиссии было сделано в 1971 г. Авторами открытия являются Г.Н. Фурсей (г. Ленинград) и Г.А. Месяц (г. Новосибирск). Ими было установлено, что под действием сильного электрического поля собственный автоэмиссионный ток с автоэлектронного эмиттера разрушает микроучасток поверхности острия катода. Этот процесс сопровождается резким возрастанием тока. Ток взрывной электронной эмиссии с одиночного острия 3
I = 3,7 ⋅ 10 − 7 U 2 vt (d − vt ) −1 , (3.22.11) где U – разность потенциалов между катодом и анодом в процессе взрывной эмиссии; d – расстояние между катодом и анодом; t – время от момента приложения импульса напряжения до момента взрыва, t < d/v, v – скорость расширяющейся плазмы; [I] = A, [U] = B, [d] = м, [t] = с. В результате взаимодействия автоэлектронов со слоем плотной плазмы вещества эмиттера вблизи поверхности острия энергетический спектр электронов при взрывной эмиссии шире, чем при автоэлектронной эмиссии. Источником взрывной эмиссии могут быть не только металлические, но и полупроводниковые острия, а также жидкие металлические катоды. Так как для деионизации плазмы и образования новых микровыступов требуется некоторое время, то катоды со взрывной эмиссией могут работать только в режиме однократных включений или малой частоты повторения. В настоящее время полевая эмиссия используется в электронной и ионной микроскопии (автоэлектронная, автоионная эмиссии). Взрывная электронная эмиссия используется в сильноточных ускорителях электронов, в импульсных источниках рентгеновского излучения высокой интенсивности, в мощных газовых лазерах, в установках для управляемого термоядерного синтеза. При этом для получения больших токов применяются многоострийные катоды. 3.22.3. Фотоэлектронная эмиссия Фотоэлектронная эмиссия – это эмиссия электронов с поверхности твердого или жидкого тела, возникающая в результате облучения поверхности электромагнитным излучением. Фотоэлектронная эмиссия впервые была обнаружена Г. Герцем в 1887 г. при изучении воздействия ультрафиолетового излучения на электрический разряд. Однако Герц не занимался систематическим исследованием обнаруженного им явления. Основные первоначаль-
238
ные результаты по изучению фотоэлектронной эмиссии были получены прежде всего в работах А.Г. Столетова, а затем Эльстера и Гейтеля, Ленарда и А. Эйнштейна. А.Г. Столетовым в 1888 г. было установлено, что фототок пропорционален первой степени интенсивности падающего света. Однако в дальнейшем оказалось, что эта зависимость характерна только для слабых световых потоков. С появлением лазеров было экспериментально показано, что фототок пропорционален n-ой степени интенсивности света. В приближении однофотонных процессов основные законы фотоэлектронной эмиссии – следующие. 1. Фототок в режиме насыщения прямо пропорционален потоку падающей электромагнитной волны. 2. Максимальная кинетическая энергия фотоэлектронов линейно возрастает с частотой падающего излучения ν и не зависит от величины падающего на поверхность потока электромагнитной волны: 2 me vmax = h ν − A, (3.22.12) 2 где me – масса покоя электрона, А – работа выхода электрона. Формула (3.22.12) впервые была получена А. Эйнштейном в 1905 г. При очень больших плотностях потока электромагнитной волны (Ф > 104 Вт/м2 ) существенными становятся многофотонные процессы, когда электрон, прежде чем покинуть поверхность освещаемого твердого тела, в процессе движения может столкнуться не с одним, а последовательно с несколькими фотонами. В этом случае вместо уравнения (3.22.12) следует записать уравнение 2 me vmax = N h ν − A, (3.22.13) 2 где N – число столкновений электрона с фотонами, сопровождающимися поглощением фотонов. Но и в этом случае существует длинноволновая граница фотоэффекта, однако граничная частота теперь определяется выражением A ν0 = , (3.22.14) Nh т. е. уменьшается в N раз. 3. Для каждого вещества существует длинноволновая граница падающего излучения λ0, выше которой фотоэффект не наблюдается, и, следовательно, существует соответствующая ей пороговая частота ν0 . 4. Фотоэлектронная эмиссия практически безинерционна.
239
Количественной характеристикой фотоэлектронной эмиссии является квантовый выход, т.е. число вылетевших электронов, приходящихся на один фотон, падающий на поверхность тела. Величина квантового выхода зависит от состояния поверхности и энергии фотонов и оказывается разной у различных тел. Фотоэлектронная эмиссия из металлов. В случае однофотонных процессов фотоэлектронная эмиссия из металлов возникает, если энергия фотона превышает работу выхода металла. Вблизи порога фотоэлектронной эмиссии для большинства металлов квантовый выход имеет величину порядка 10-4 электрон/фотон. Столь малая величина квантового выхода объясняется тем, что падающий на поверхность металла поток фотонов поглощается в нем вблизи поверхности на глубине порядка 10-7 м. Возникшие фотоэлектроны сильно взаимодействуют с электронами проводимости, быстро теряя полученную от фотонов энергию. В результате энергию, достаточную для преодоления работы выхода, сохраняют только те фотоэлектроны, которые возникли вблизи поверхности металлов на глубине, не превышающей 10-9м. При ν > ν0 квантовый выход для всех металлов возрастает с ростом частоты колебаний в падающей электромагнитной волне. Вблизи красной границы величина фототока, как следует из опыта, I ф = I 0 ⋅ (ν − ν 0 ) 2 . (3.22.15) При анализе взаимодействия потока электромагнитных волн с металлами можно выделить три области спектра частот. 1. ν < τ-1, τ – время релаксации возбужденных состояний электронов в зоне проводимости, τ ≈ 10-13 с. В этой области металл сильно отражает падающее электромагнитное излучение, коэффициент поглощения практически постоянный и не зависит от частоты ν. Область соответствует дальнему инфракрасному и СВЧ - диапазонам частот. 2. τ-1 < ν < νpv , 1
⎛ e ne ⎞ 2 ⎟⎟ , ν p v = ⎜⎜ (3.22.16) ⎝ 2 π ε 0 me ⎠ νpv – плазменная частота колебаний электронов в ЭФЖ; ne – концентрация электронов проводимости, ε0 – электрическая постоянная. В области 2 коэффициент отражения имеет значительную величину, а коэффициент поглощения убывает с ростом частоты пропорционально ν2. Неравенство ν > νpv (νpv – частота объемного плазмона) соответствует области ультрафиолетовой прозрачности металлов. Крас-
240
ная граница однофотонной фотоэлектронной эмиссии обычно находится в области, которая охватывает оптический интервал частот. 3. ν ≥ νps (νps – частота поверхностного плазмона) соответствует резкому росту фототока. Величина ν = νps соответствует второй красной границе фотоэлектронной эмиссии. Первая теория фотоэлектронной эмиссии была разработана Р. Фаулером в 1931 г. В основу теории были положены следующие допущения. 1. Электроны в металле являются свободными, т.е. находятся в потенциальной яме с плоским дном. 2. В фотоэлектронной эмиссии принимают участие электроны с энергией близкой к энергии Ферми. 3. Коэффициент отражения на границе раздела для электронов с полной энергией больше потенциальной равен нулю и равен единице для всех электронов, находящихся в потенциальной яме. 4. Неупругие столкновения электронов проводимости приводят к такой потере энергии, при которой электрон не в состоянии вылететь за пределы металла и остается в пределах потенциальной ямы. При использовании таких предположений ЭФГ в металле можно рассматривать как смесь двух газов – "холодного" (невозбужденного) и "горячего" (возбужденного). Энергетический спектр у "горячих" электронов предполагается таким же, как и у "холодных", со смещением вверх по шкале энергий на величину энергии фотона hν, что эквивалентно снижению на ту же величину высоты потенциального барьера. Выполненный расчет показал, что при Т = 0 К фототок фотоэлектронной эмиссии 2 π e me α s (ν − ν 0 )2 , Iф = (3.22.17) h ν > ν0 ; α – относительное число горячих электронов по отношению к холодным (постоянная определяется из опыта); S – площадь освещаемой поверхности металла. При Т > 0 К и ν < ν0 фототок ассимптотически стремится к нулю, и, следовательно, красная граница должна отсутствовать. Однако в случае ν0 ≤ ν ≤ 1,5 ν0 уравнение (3.22.17) все-таки выполняется. Из сравнения формул (3.22.16) и (3.22.15) следует, что теория Фаулера хорошо соответствует опыту лишь вблизи "красной" границы спектра. Следовательно, теория Фаулера имеет ограниченную применимость и недостаточное познавательное значение.
241
В 1964 г. В. Спайсером была предложена теория, согласно которой процесс выхода фотоэлектронов из металлов следует разделить на три последовательных процесса: 1. поглощение фотона и появление в твердом (или жидком) теле фотоэлектрона с энергией более высокой по сравнению со средней энергией электронов проводимости; 2. движения фотоэлектрона к поверхности, сопровождающегося рассеянием энергии; 3. выход фотоэлектрона в другую среду через поверхность раздела. Полученное в этой теории выражение для фототока имеет весьма сложный вид и содержит несколько подгоночных параметров, значения которых можно определить только из эксперимента. Наличие определяемых из опыта параметров делают теорию неудобной как для практического использования, так и для анализа физических процессов в фотоэлектронной эмиссии. Таким образом, строгая теория фотоэлектронной эмиссии до сих пор еще не создана. Но очевидно, что эта теория должна основываться на квантовомеханическом рассмотрении возбуждения фотонами электронов металла с последующим использованием уравнения кинетической теории переноса, в которое следует ввести микроскопические параметры взаимодействия как фотонов с электронами проводимости, так и фотоэлектронов с электронами проводимости металла. Фотоэлектронная эмиссия из полупроводников. В полупроводниках фотоэлектронная эмиссия может быть вызвана возбуждением электронов из валентной зоны, с уровней примесей, из зоны проводимости и др. Для каждого из этих случаев пороговая частота ν имеет свое значение. Если полупроводник собственный, то минимальная энергия квантов, достаточная для перехода электронов из валентной в зону проводимости, равна ширине запрещенной зоны. Отсюда следует, что эффективность фотоэлектронной эмиссии при заданной ширине запрещенной зоны ∆ε0 определяется электронным сродством χ . Тогда красная граница фотоэлектронной эмиссии будет определяться из уравнения h ν 0 = ∆ε 0 + x. (3.22.18) Следовательно, в вакуум могут перейти лишь те электроны, которые достигают поверхности эмиттера с энергией, достаточной для преодоления потенциального барьера высотой χ . Создание на поверхности отрицательного электронного сродства позволяет существенно повысить квантовый выход фотоэлектронной эмиссии. Для соз-
242
дания отрицательного электронного сродства используются полупроводники р-типа, у которых при сильном легировании уровень Ферми почти совпадает с верхней границей валентной зоны.
242
Глава 4. ОСНОВЫ ФИЗИКИ АТОМНОГО ЯДРА 4.1. Элементарные частицы Ядра атомов любого вещества состоят из протонов и нейтронов, имеющих единое название – нуклоны. Других частиц в составе атомного ядра нет. Существующие в природе мельчайшие стабильные и метастабильные частицы называются элементарными частицами. Многие из них возникают в результате взаимодействий, т.е. столкновений с другими элементарными частицами вещества. Время взаимодействия между элементарными частицами настолько мало, что не поддается точному измерению. Неточность измерения времени взаимодействия ∆t сравнима с временем жизни многих элементарных частиц. Поэтому для оценки энергии взаимодействия частиц можно воспользоваться соотношением неопределенности ∆ε∆t > h. Неопределенность энергии взаимодействия ∆ε должна быть всегда меньше энергии взаимодействия ε, в противном случае частица не может быть обнаружена, т.е. ε ≥ ∆ε . С учетом соотношения неопределенности получаем h ε≥ . ∆t Уточним физический смысл понятия элементарная частица. Прежде всего, в понятии "элементарная частица" в современной физике находит отражение идея о наличии в природе первичных сущностей материи, которые определяют все известные свойства материи. До начала двадцатого века считалось, что вся материя состоит из атомов. Заметим, что атом в переводе на русский язык означает неделимый. Атомы в то время считались элементарными частицами материи. Но с развитием экспериментальной техники было установлено, что атом состоит из ядра и электронной оболочки. В дальнейшем открывались все новые и новые микрочастицы (мюоны, пионы и др.), которые также можно было принять за элементарные частицы. Термин элементарная частица несколько "размыт", т.е. нельзя с полной достоверностью утверждать, существуют ли в природе действительно элементарные частицы. Сведения о внутренней структуре элементарных частиц могут быть получены только на основе анализа результата столкновений между ними, причем полная энергия столкновений должна быть та-
243
кой, при которой у сталкивающихся частиц начинает проявляться внутренняя структура. Исторически первой открытой элементарной частицей был электрон, обнаруженный Дж. Томсоном в катодных лучах (1897 г.). В 1919 г. Э. Резерфорд среди частиц, выбитых из атомных ядер, обнаружил протоны. Другая частица, входящая в состав ядра, нейтрон, была открыта в 1932 г. Дж. Чедвиком. Представление о возможности существования частицы электромагнитного поля, фотона, берет свое начало с работы М. Планка (1900 г.). Развивая идею М. Планка, А. Эйнштейн (1905 г.) постулировал, что электромагнитное излучение является потоком отдельных квантов энергии, фотонов, и на основе этого объяснил некоторые особенности внешнего фотоэффекта. Прямые экспериментальные доказательства существования фотона были даны Р. Милликеном (1912–1915 гг.) и А. Комптоном (1922 г.). Открытие нейтрино связано с теоретической догадкой В. Паули (1930 г.). Но экспериментальное подтверждение было дано лишь в 1953 г. работами Ф. Райнеса и К. Коуэна. Затем в космических лучах экспериментально были обнаружены: в 1932 г. К. Андерсоном – позитрон, в 1936 г. К. Андерсоном и С. Неддермейером – мюон, в 1947 г. С. Пауэллом с сотрудниками – π мезоны. В 1940–1950 гг. была обнаружена большая группа частиц с необычными свойствами, получивших название странных (К-мезоны, Λ-гипероны и др.). В 1955–1956 гг. открыты анитипротон, антинейтрон. За время с 1960 г. по 1970 г. на ускорителях было открыто большое число крайне неустойчивых частиц, получившие название резонансов. В 1962 г. было установлено, что существуют два различных типа нейтрино: электронное и мюонное. В 1975 г. были получены первые сведения о существовании тяжелого лептона – аналога электрона и мюона, τ - мезона. Соответственно принято, что существует третий тип нейтрино – τ - мезонное. Неожиданными оказались и свойства у большинства элементарных частиц. Для их описания, помимо характеристик, заимствованных из классической физики, таких как электрический заряд, масса, момент импульса, потребовалось введение многих новых специальных характеристик. Ввиду неоднозначности понятия, в настоящее время термин элементарная частица обычно употребляется не в точном смысле этого слова, а менее строго – для наименования большой группы мельчайших частиц, подчиненных условию, что они не являются атомами или атомными ядрами. Эта группа частиц необычайно обширна, в нее, в
244
частности, входят протон, нейтрон, лептоны, т.е. электрон, мюон и тау-мезон со своими античастицами и нейтрино, фотон, π-мезон, странные частицы, резонансы – несколько сотен частиц, в основном нестабильных. Имеются серьезные основания считать, что большинство элементарных частиц обладает внутренней структурой, но в то же время у таких частиц, как, например, электрон, нейтрино, внутренней структуры не обнаружено. 4.1.1. Основные свойства элементарных частиц Микроскопические массы и микроскопические размеры элементарных частиц определяют их квантовые и волновые свойства. Характерную длину волны де Бройля элементарной частицы массы m можно вычислить по формуле: h λ= , mc где h – постоянная Планка, с – скорость света в вакууме. Вычисленная длина волны по порядку величины близка к типичным расстояниям, на которых осуществляется взаимодействие между этими частицами. Так, у π-мезона λ ≈ 1,4 10-15 м, т.е. по порядку величины примерно равна эффективному радиусу взаимодействия πмезона. Из этого следует, что квантовые закономерности здесь являются решающими. Наиболее важным свойством всех элементарных частиц является способность рождаться и уничтожаться, что соответствует их испусканию и поглощению. Опыт показывает, что все процессы с элементарными частицами протекают через последовательность актов их поглощения и испускания, при этом в зависимости от особенностей взаимодействия они отличаются длительностью и интенсивностью взаимодействия. Все взаимодействия между элементарными частицами можно разделить на четыре вида: сильное, электромагнитное, слабое, гравитационное. Сильное взаимодействие соответствует самой сильной связи между элементарными частицами. При сильном взаимодействии процессы протекают наиболее интенсивно по сравнению с другими видами взаимодействий между элементарными частицами. Частицы, участвующие в сильных взаимодействиях, называются адронами. В настоящее время известно несколько сот их разновидностей. Существуют стабильные и нестабильные адроны. Стабильные адроны подраз-
245
деляются на мезоны (спин 1) и барионы (спин 1/2). К нестабильным адронам, в частности, относятся резонансы, нестабильные относительно сильного взаимодействия элементарные частицы. Величина сильного взаимодействия не зависит от величины и знака электрического заряда адрона. Сила взаимодействия между адронами короткодействующая, время взаимодействия между ними порядка 10-23 с. Электромагнитное взаимодействие – это взаимодействие между элементарными частицами, осуществляемое посредством электромагнитного поля. Время взаимодействия порядка 10-20 с, т.е. во много раз превышает время сильного взаимодействия и, следовательно, простирается на большие расстояния. Электромагнитное взаимодействие значительно слабее сильного, оно определяет величину связи атомных электронов с ядром, величину связи между атомами в молекулах, а также твердых и жидких веществах. Слабое взаимодействие – это взаимодействие между элементарными частицами, которое соответствует самой слабой связи между ними по сравнению с сильным и электромагнитным. Оно вызывает медленно протекающие процессы с участием элементарных частиц. Время взаимодействия 10-19 с. Эффективный радиус взаимодействия не превышает 10-18 м, поэтому оно всегда слабее электромагнитного, которое, в свою очередь, до расстояний 10 −15 м всегда слабее сильного. На расстояниях меньших 10-18 м слабое и электромагнитное образуют единое электрослабое взаимодействие. Частицы, обладающие только слабым взаимодействием, в среднем практически не взаимодействуют с веществом. В гравитационном взаимодействии участвуют все без исключения элементарные частицы. Но так как массы частиц малы, то гравитационные силы по сравнению с остальными на много порядков слабее, поэтому в физике элементарных частиц их обычно не учитывают. Гравитационное взаимодействие между элементарными частицами может быть существенным только на расстояниях порядка 10-35 м. В зависимости от участия в тех или иных видах взаимодействий все изученные элементарные частицы делятся на четыре основные группы: адроны, лептоны, фотоны, бозоны*). Современная классификация взаимодействий и элементарных частиц приведена в учебных пособиях по физике последних лет издания, например: Детлаф А.А., Яворский Б.М. Курс физики. 4-е изд. М.: Издательский центр «Академия», 2003. 720 с. *)
246
Адроны обладают сильным, электромагнитным и слабым взаимодействиями. Лептоны обладают только электромагнитным и слабым взаимодействием и образуют два семейства: 1. электрон, мюон, τ-мезон; 2. нейтрино (электронное, мюонное, τ-нейтрино). Фотоны – это группа элементарных частиц, являющихся переносчиками электромагнитного взаимодействия большой энергии. У фотонов спиновое квантовое число равно 1. Бозоны являются переносчиками слабого взаимодействия, они были обнаружены лишь в 1983 году. Бозоны – частицы с целыми спиновыми квантовыми числами 0, 1, 2, они подчиняются статистике БозеЭйнштейна. Бозоны могут быть двух видов: W-бозон и Z-бозон, у них спиновое квантовое число равно 1 . Большинство адронов и все лептоны имеют свои античастицы, отличающиеся от исходных частиц лишь противоположными знаками соответствующих зарядов, нейтрино не имеют электрического заряда, но в природе существуют нейтрино и антинейтрино. Во всех взаимодействиях элементарных частиц выполняются законы сохранения энергии, импульса, момента импульса, электрического и барионного зарядов, а также зарядов, имеющих иное физическое происхождение, которые здесь мы не обсуждаем из-за специфики вопроса. Барионам приписывается барионный заряд В = +1, антибарионам В = -1. Барионный заряд остальных частиц В = 0. Кроме того, существуют следующие лептонные заряды: электронный ℓe, электронного нейтрино ℓve, мюонный ℓµ, мюонного нейтрино ℓvµ, τ-мезонный ℓτ, τмезонного нейтрино ℓvτ. Электрону и электронному нейтрино приписывают заряд ℓe=ℓve=1; мюону и мюонному нейтрино приписывают заряд ℓµ=ℓvµ=1; τ-мезону и τ-мезонному нейтрино приписывают заряд ℓτ=ℓvτ=1. Остальные элементарные частицы лептонным зарядом не обладают. Следует заметить, что понятия "барионный, лептонный" заряды надо понимать не в прямом смысле слова как электрический заряд, а в смысле некоторого квантового числа, с помощью которого отображаются определенные физические свойства элементарных частиц. Для всех перечисленных зарядов в процессах взаимодействия выполняются законы сохранения для каждого из видов заряда, это значит, что суммарный одноименный заряд до взаимодействия равен суммарному одноименному заряду после взаимодействия.
247
4.1.2. Кварковая структура адронов В 1964 г. М. Гелл-Манном (США) и независимо от него Г. Цвейгом (Швейцария) была выдвинута гипотеза, что все адроны состоят из каких-то фундаментальных структурных элементов материи, кварков. В дальнейшем оказалось, что модели элементарных частиц, построенные из кварков и антикварков, находятся в хорошем согласии с экспериментальными результатами. Например, рассеяние быстрых электронов на нуклонах показало, что протон содержит три точечных рассеивающих центра: два из них с зарядами 2/3e и один с зарядом (-1/3е). Для согласования кварковой структуры некоторых элементарных частиц с принципом Паули понадобилось приписать кваркам дополнительные квантовые числа, получившие название "цвет", "очарование" и др. Кроме того, пришлось ввести еще один структурный элемент материи, с помощью которого осуществляется взаимодействие между кварками, этот структурный элемент был назван глюоном. Таким образом, глюоны – это посредники, переносящие взаимодействие между кварками. В зависимости от комбинаций цветов кварков вводятся 8 различных глюонов. Масса покоя глюона mг = 0, спин Sг= 1. Глюоны не только осуществляют взаимодействие между кварками, но могут взаимодействовать между собой. Свойства глюонов таковы, что на больших расстояниях силы взаимодействия становятся настолько значительными, что появление кварков в свободном состоянии оказывается невозможным. И наоборот, на малых расстояниях силы взаимодействия оказываются настолько незначительными, что на таких расстояниях кварки можно считать свободными частицами. Эта особенность сильного взаимодействия получила название асимптотической свободы. Кварковая модель не только правильно описывает свойства известных элементарных частиц, но и предсказывает существование новых, которые действительно обнаруживаются в экспериментах. Итак, все виды адронов состоят из кварков. Минимальное число сортов кварков 6. Кварки имеют спин 1/2, барионный заряд 1/3, дробный электрический заряд, а также еще 4 квантовых числа, но для их обоснования необходимы знания, выходящие за пределы курса общей физики, поэтому их здесь мы не обсуждаем. Барионы состоят из 3-х кварков, мезоны – из 2-х кварков. В табл. 4.1.1 приводятся условные обозначения кварков, их электрический заряд и их относительные массы.
248
Обозначение кварка u d s c b t
Электрический заряд 2/3 e -1/3 e -1/3 e 2/3 e -1/3 e 2/3 e
m/me 9,79 13,7 293,5 2642 9198
Таблица 4.1.1. Некоторые свойства кварков (e – заряд электрона; m – масса кварка, me – масса покоя электрона) В табл. 4.1.2 в качестве примера приводится кварковый состав нуклонов (протонов, нейтронов) и π-мезонов, а также относительные их массы и время жизни в свободном состоянии.
p n π+ π0 π-
S 1/2 1/2 0
m/me 1836,2 1838,7 273,1
Среднее время жизни стабилен 918с=15,3мин 2,6·10-8 с
2(uu − dd )
B 1 1 0 0
0
264,1
8,3·10-17 с
du
0
0
273,1
2,6·10-8 с
uud ddu
ud
Таблица 4.1.2. Кварковый состав нуклонов и π-мезонов ( u , d – антикварки; В – барионный заряд; S – спиновое квантовое число; m – масса элементарной частицы, me – масса покоя электрона) Из анализа состава элементарных частиц видно разнообразие их свойств и характеристик Резко различаются между собой их массы, времена жизни. Почти у каждой частицы имеется ее двойникантичастица, в связи с чем их число сразу же должно быть увеличено почти вдвое. Большие группы частиц объединены под названием резонансы. Характерным для этих частиц является малое время жизни (~10-23с), все они рассматриваются как различные возбужденные состояния одной частицы, например нуклона. В табл. 4.1.3 приведены основные характеристики некоторых элементарных частиц.
249
Условные обозначения
Масса покоя Спиновое кван- Среднее время МэВ товое число жизни Фотон 0 1 стабильны ν Лептоны (ℓ = 1) e0,511 1/2 стабильны -5 νe< 0,3·10 1/2 стабильны µ105,7 1/2 2,2·10-6 с νµ< 0,51 1/2 стабильны τ1782 1/2 3,4·10-12 c < 250 1/2 ? ν τПринятые обозначения: e- – электрон, µ- , τ- – мюоны и τмезоны, ν e-, ν µ- – нейтрино Мезоны (В = 0) π+, π139,6 0 2,6·10-8 c 0 π 135,0 1 8,31·10-17 c 493,7 0 1,24·10-3 c K Принятые обозначения: π – π-мезоны, K – K-мезон. Барионы (B = 1) 938,280 1/2 стабильны p 939,573 1/2 918 с n Λ 1115,6 1/2 2,63·10-10 с Принятые обозначения: p – протон, n – нейтрон, Λ – гиперон.
Таблица 4.1.3. Основные характеристики элементарных частиц Говоря о том, что почти каждой частице соответствует своя античастица, необходимо остановиться на одном поразительном факте. Астрономические исследования показывают, что видимая нами Вселенная состоит только из образующих атомы протонов, нейтронов и электронов, а не из их античастиц. Если бы во Вселенной вещество соседствовало с антивеществом, то на границе их соприкосновения происходили бы процессы аннигиляции. Однако излучений с характерными для этих процессов энергиями не наблюдается. Можно, конечно, предположить, что скопления галактик, отделенных друг от друга громадными расстояниями, могут состоять как из вещества, так и из антивещества. Однако ни одна из космологических моделей не предложила еще такой модели развития Вселенной. Античастицы очень редко наблюдаются в приходящих из космоса лучах. Наблю-
250
даемое в настоящее время во Вселенной отношение числа антинуклонов к числу нуклонов оказывается примерно равным 10-9. Указанное свойство получило название барионной асимметрии Вселенной. Эта же величина характеризует отношение среднего числа фотонов к среднему числу нуклонов во Вселенной. 4.2. Строение атомного ядра Ядро любого атома, кроме атома легкого водорода, состоит из двух типов частиц: Z – протонов и N – нейтронов, причем протоны имеют электрический заряд q = e > 0, а нейтроны электрическим зарядом не обладают. Обобщено эти частицы называются нуклонами. Кроме того, в ядерной физике часто используется слово нуклид. Под словом нуклид понимается ядро атома любого химического элемента с указанными значениями Z и N. В физике атомного ядра, наряду с другими единицами, за единицу массы принята атомная единица массы, сокращенно а.е.м. 1 а.е.м. =1,66 10-27 кг. Тогда масса протона mp = 1,67265 10-27 кг, а масса нейтрона mn=1,67495 10-27 кг, т.е. mn > mp. Общее число протонов и нейтронов в ядре A = Z + N, A – массовое число. Массовое число A в основном определяет массу ядра, а также массу атома в целом. Однако химические свойства атомов все-таки определяются не числом нуклонов в ядре, а числом валентных электронов в электронной оболочке атома. Полное число электронов в нейтральном атоме всегда равно порядковому номеру в периодической таблице элементов, т. е. Z – зарядовому числу. Значит, число электронов в нейтральном атоме равно числу протонов в ядре. Других частиц в ядре, кроме нуклонов, нет. Условное обозначение нуклида в основном состоянии ZA X , где X – символ химического элемента. Например, нуклиды углерода и кислорода имеют следующие обозначения: 126C , 168O . Атомы, ядра которых имеют одинаковые зарядовые числа Z и различные массовые числа A, имеют одни и те же химические свойства и называются изотопами. Изотопы одного и того же химического элемента различаются друг от друга лишь по числу нейтронов в ядре. Большинство веществ с атомами одного и того же Z представляют смесь различных изотопов. Так, углерод имеет 3 изотопа: 126C , 136C , 146C ;
кислород также имеет 3 изотопа:
15 16 17 8 O, 8 O, 8 O
. Разумеется, процент-
251
ное содержание каждого из изотопов в природе неодинаково. Так, процентное содержание в природе изотопов 126С , 168O наибольшее по сравнению с другими одноименными изотопами этих элементов.
H
% 99,985
T -
H =D
0,015
-
H =T
-
12,26 года
He
0,00013
-
He
100
-
Z 1
2
3
4
X 1 1 2 1 3 1
3 2 4 2 6 2 6 3
He
-
0,81 c
Li
7,4
-
7 3
Li
92,6
-
8 3
Li
-
0,84 c
9 3
Li
-
0,17 c
7 4 8 4 9 4 10 4
Be
-
53 дня
Be
-
1·10-16 с
Be
100
-
Be
-
3·106 лет
Таблица 4.2.1. Изотопы и изобары некоторых легких ядер Атомы, ядра которых имеют одни и те же массовые числа, называются изобарами. Одни и те же изобары, т.е. ядра с различными Z, соответствуют ядрам атомов различных химических элементов. В табл. 4.2.1 в качестве примера приводятся изотопы и изобары некоторых легких ядер, их процентное содержание в природе, а также период полураспада нестабильных ядер. 4.3. Энергия связи ядра
Атомное ядро представляет собой систему, состоящую из A нуклонов, удерживаемых в ядре силами связи. Если бы мы пожелали разделить эту систему на составляющие ее нуклоны, то пришлось бы
252
совершить работу против действия сил связи, существующих между нуклонами ядра. Величина этой работы и является мерой энергии связи, мерой прочности ядра. Поэтому энергия связи является одной из важнейших характеристик атомного ядра. Итак, между нуклонами ядра всегда действуют особые силы взаимодействия – ядерные силы. Положительно заряженные протоны и электрически нейтральные нейтроны благодаря действию этих сил образуют чрезвычайно устойчивое образование – ядро. Устойчивость ядра означает, что между нуклонами такого ядра существует сильная связь, действуют большие силы притяжения. Изучение этой связи в известных пределах может быть проведено без привлечения сведений об особенностях и свойствах ядерных сил. Такой подход основан на использовании закона сохранения энергии, он носит общий характер и позволяет сделать ряд важных выводов о специфике тех связей, которые удерживают нуклоны в ядре. На основании сказанного можно дать такое определение энергии связи: энергией связи называется та энергия, которую необходимо сообщить ядру, чтобы разделить его на составляющие его нуклоны без сообщения им за пределами ядра дополнительной энергии. Эту энергию в дальнейшем будем обозначать εсв. Так как на расщепление ядра необходима затрата энергии, то обратный процесс – процесс образования ядра (синтеза ядра) из нуклонов – всегда должен сопровождаться выделением энергии, равной той, которую необходимо затратить на расщепление ядра на составные его части. Итак, если ядро устойчиво, то полная энергия частиц в ядре должна быть меньше полной энергии, которой бы обладали нуклоны до образования ядра. Поэтому синтез ядер из протонов и нейтронов всегда сопровождается высвобождением энергии, равной энергии связи εсв, и соответствующим изменением эквивалентной этой энергии массы: ε ∆M = св2 , (4.3.1) c где εсв – полная энергия связи в расчете на все нуклоны ядра; ∆M – дефект массы: ∆M = Z m p + ( A − Z ) mn − M я . (4.3.2) где m p – масса протона, mn – масса нейтрона, m я – масса ядра.
253
Заметим, что в периодической таблице элементов всегда приводится масса атома, а не масса ядра, поэтому с целью удобства в практическом ее применении формулу (4.3.2) можно переписать по-иному: ∆M = Z mн + ( A − Z ) mn − M а , (4.3.3) где mH – масса атома водорода, т.е. масса протона вместе с электроном, Ma – масса атома. Так как всегда ∆M > 0, то при синтезе ядра из протонов и нейтронов выделяется энергия, пропорциональная ∆M. Разумеется, это будет верно, если данное ядро в дальнейшем находится в устойчивом (невозбужденном) состоянии. Сравним теперь энергию, которая высвобождается при синтезе ядер из нуклонов, с энергией, которая высвобождается при образовании молекул и атомов: при синтезе ядер ∆ε/ε ≤ 10-4, где ε – полная энергия ядра, при синтезе молекул ∆ε/ε < 10-10, где ε – полная энергия молекулы. Используя эти данные, можно показать, что силы взаимодействия между атомами в молекуле примерно в 106 раз меньше сил взаимодействия между нуклонами ядра. Найдем энергию, соответствующую 1 а.е.м. =1u, где u – углеродная единица массы:
1u = M (126C ) / 12, εu = 1uc 2 = 931 ⋅106 эВ = 931 МэВ Поэтому, если дефект массы измерять в единицах а.е.м. , то εсв=931 ∆М, МэВ. (4.3.4) Средняя энергия связи, приходящаяся на один нуклон ядра, является важнейшей характеристикой ядра. Опыт показывает, что средняя энергия связи в расчете на один нуклон сложным образом зависит от массового числа A. Эту зависимость приближенно проще всего изобразить графически (рис. 4.3.1), Из графика на рис. 4.3.1 видно, что средняя энергия связи, приходящаяся на один нуклон, сначала возрастает, достигая максимального значения 8,7 МэВ, когда A ≈ 60. Последующее увеличение числа нуклонов в ядре приводит к постепенному ослаблению связи между нуклонами. Для тяжелых ядер (A > 200) величина <εсв>/A уменьшается до 7,5 МэВ. Заметим, что указанный график относится только к средним значениям <εсв>/A. Однако в природе имеют место отклонения от приведенных средних значений. Так, если в ядре содержатся 2, 8, 20, 28, 50, 82 протонов или 2, 8, 20, 28, 50, 82, 126 нейтронов, то для таких чисел нуклонов энергия связи несколько возрастает по
254
сравнению с соответствующей средней энергией связи. Эти числа называются магическими. ε св
10
A
, МэВ
8 6
4 2 0
50
100
150
200
250
A
Рис. 4.3.1. Средняя энергия связи Значит, ядра, в которых одновременно содержатся магическое число протонов и магическое число нейтронов, обладают повышенной стабильностью. К ним, в частности, относятся ядра 4 16 40 208 2 He, 8 O, 20 Ca, 82 Pb, а также некоторые другие ядра атомов. Протоны и нейтроны в дважды магических ядрах наиболее плотно упакованы, поэтому значения <εсв>/A у дважды магических ядер больше, чем у рядом расположенных на рис. 4.3.1 ядер. Энергии отрыва отдельных протонов и отдельных нейтронов не совпадают как между собой, так и с величиной <εсв>/A . Из графика на рис. 4.3.1 также следует, если тяжелое ядро неустойчиво, то оно может распадаться на два ядра, например, 250 150 100 Z X → Z1 X + Z 2 X + Q1 , при этом выделяется избыточная энергия Q1 . Если же синтезировать ядро из более легких ядер, например, 2 2 4 1 H + 1H → 2 He + Q2 , то будет выделяться энергия Q2 = (6,0 - 0,2) МэВ = 5,8 МэВ, где (εсв / A) 2 H = 0,1 МэВ, (εсв / A) 4 He = 6,0 МэВ, причем Q1 < Q2. Поэтому 1
2
реакция синтеза ядер энергетически более выгодна по сравнению с реакцией распада ядра. Однако в настоящее время в промышленных
255
целях освоена лишь реакция деления тяжелых ядер, которая используется в частности, на атомных электростанциях. Установки, основанные на синтезе ядер, продолжают разрабатываться – это термоядерные реакторы, их промышленное использование – дело будущего. 4.4. Ядерные силы
Ядра большинства природных изотопов представляют собой очень устойчивые образования. Нейтроны и протоны в них удерживаются мощными ядерными силами притяжения. Поэтому в ядре ядерные силы притяжения, наряду с кулоновскими силами отталкивания между протонами, образуют устойчивую систему частиц. Интересно отметить, что ядерные силы между двумя протонами, между двумя нейтронами, между протоном и нейтроном всегда одинаковы. Поэтому как протоны, так и нейтроны рассматриваются как разные состояния одной частицы – нуклона. Величина ядерных сил не зависит от наличия или отсутствия электрического заряда нуклона. Следовательно, ядерные силы имеют совершенно иную природу, отличающуюся от природы электромагнитных, гравитационных и других сил. Если внимательно проанализировать различные типы ядерных реакций, то оказывается, что в природе не наблюдается процессов исчезновения нуклонов. Это эквивалентно тому, что у нуклонов существует какое-то свойство, какое-то качество, какая-то характеристика, которая в любой ядерной реакции сохраняется неизменной. Эта характеристика условно названа барионным зарядом. Стало быть, в природе должен выполняться закон сохранения барионного заряда. Сущность закона сохранения барионного заряда состоит в том, что сумма барионных чисел до и после ядерной реакции должна оставаться неизменной. Протоны и нейтроны обладают барионным зарядом В = +1. Но в природе, наряду с ними, существуют нуклоны, у которых барионный заряд В = -1. К ним, в частности, относятся антипротоны, антинейтроны. Эти, а также другие барионы различаются между собой лишь знаками барионного и электрического зарядов, разумеется, если у такого бариона электрический заряд вообще существует. Поэтому в общем случае В = +1, -1, а q = 0,+e,-, где e=1,6 10-19 Кл. Каковы же особенности ядерных сил? 1. Прежде всего, ядерные силы – короткодействующие. К такому заключению можно прийти на основании анализа графика <εсв>/A на рис. 4.3.1.
256
Пусть в системе находятся A взаимодействующих между собой нуклонов. Каждому взаимодействию соответствует своя энергия взаимодействия, а полная энергия взаимодействия есть энергии связи. Следовательно, для оценки величины энергии связи необходимо подсчитать полное число взаимодействий. Найдем полное число взаимодействий на примере ядра, состоящего из 4-х нуклонов. В этом случае на каждый из нуклонов со стороны соседних будут действовать 3 силы. На рис. 4.4.1 изображены рассматриваемые 4 нуклона и указаны силы, действующие на нуклон 1 со стороны остальных трех нуклонов. 1
2
4
3
Рис. 4.4.1. Схема взаимодействия в ядре из 4-х нуклонов Составляя равнодействующие всех сил для каждого из изображенных нуклонов, можно получить систему уравнений. В общем случае число таких уравнений равно массовому числу A, а число сил, входящих в равнодействующую всех сил для каждого нуклона, равно A - 1: A −1 ρ 6ρ 4 4 7ρ 4 48ρ ⎫ F1 = F12 + F13 + F14 ⎪ ρ ρ ρ ρ ⎪ F2 = F21 + F23 + F24 ⎪⎬ A ρ ρ ρ ρ F3 = F31 + F32 + F34 ⎪ ρ ρ ρ ρ ⎪ F4 = F41 + F42 + F43 ⎪⎭ В полученной системе уравнений всегда имеются повторяющиеся силы: F12 = F21, F13 = F31, F14 = F41 и т.д. Полное число взаимодействий будет 1 ( A − 1) A. 2 А так как каждой силе соответствует своя энергия взаимодействия, то полная энергия взаимодействий, т.е. энергия связи
257
ε св =
k ( A − 1) A, 2
где k – нормирующий множитель. Энергия связи, приходящаяся на один нуклон ядра, ε св k = ( A − 1). A 2 Теперь обратимся к графику <εсв>/A. Из графика на рис. 4.3.1 следует, что в области малых значений A наблюдается практически линейная зависимость от A. Но это как раз и свидетельствует о том, что в легких ядрах каждый нуклон взаимодействует с каждым нуклоном. Однако в области больших A пропорциональность между <εсв>/A и A не имеет места. Это означает, что теперь взаимодействие нуклона с другими нуклонами охватывает лишь его ближайших соседей, взаимодействие с удаленными нуклонами отсутствует. Следовательно, ядерные силы являются короткодействующими. Радиус действия ядерных сил весьма мал и не превышает 1,4 Ф. Для справки укажем: 1 Ф = 1 Ферми = 1⋅10-15 м. Кроме того, из графика на рис. 4.3.1 следует < εсв > k lim =− , A→ 0 2 A что также соответствует опыту. 2. Ядерные силы способны к насыщению, т.е. каждый нуклон может взаимодействовать только с ограниченным числом соседних нуклонов, находящихся на расстоянии не далее, чем на 1,4 Ф. Свойство насыщения ядерных сил аналогично свойству насыщения валентных связей в химических соединениях или, допустим, в полупроводниках n-типа. Действительно, в каждой устойчивой молекуле один атом может быть связан лишь с ограниченным числом других атомов. Так, например, два атома водорода образуют устойчивую химическую связь только с одним атомом кислорода, и при этом возникает молекула воды H2O. Известно, что в природе существует молекула H2, но нет молекул H3. Если же к двум атомам водорода присоединить два атома кислорода, то получится неустойчивое химическое соединение H2O2. Что же касается химического соединения H2O3, то оно в природе вообще не встречается. Из этого следует, что валентные связи обладают свойством насыщения. Примерно то же самое имеет место и для нуклонов. Каждый нуклон наиболее прочно связан лишь с ограниченным числом нуклонов, расположенных на расстояниях меньше 1,4 Ф. В легких ядрах наиболее сильно связаны нуклоны в ядрах атомов
258 4 2 He
. И вообще, наиболее сильная связь возникает в ядрах с дважды магическими числами нуклонов – магическими числами протонов и магическими числами нейтронов. В таких ядрах между нуклонами образуются насыщенные связи, поэтому такие ядра являются наиболее стабильными. Отсюда легко понять, почему ядро 48 Be является неустойчивым. Связано это с тем, что ядро
8 4
Be как бы состоит из
4 2
He с насыщенными связями). Это приводит к тому, что время жизни ядер 48 Be мало (см. таблицу изотопов), у них период подвух ядер
лураспада порядка 10-16 с. Так как в ядре 24 He все связи насыщены, то, если к ядру 24 He добавить еще один нуклон – протон или нейтрон, возникает нестабильное ядро либо 35 Li , либо 25 He . Но эти ядра, первоначально возникнув, мгновенно распадаются, они в природе и в лабораторных условиях не существуют. У ядер с насыщенными связями энергия связи на один нуклон наибольшая. Вот почему после ядер 24 He возникает стабильное ядро 7 3
Li , а не ядро 35 Li . Все это приводит нас к мысли о том, что в ядре,
как и в атоме, существуют нуклонные оболочки. Тогда у ядра атома 4 2 He нуклонная оболочка оказывается полностью заполненной и дальнейшее увеличение числа нуклонов в ядре приводит к постепенному заполнению новой нуклонной оболочки. Здесь застройка новой нуклонной оболочки начинается с ядра атома 37 Li . Нечто подобное имеет место и в атомах. Атом, у которого электронная оболочка 1s2 полностью заполнена, обладает большой инертностью к химическим реакциям. У таких атомов К-слой полностью заполнен. Таким атомом является атом He. По мере возрастания порядкового номера элемента происходит заполнение следующей электронной оболочки, и, наконец, когда полностью заполняются состояния 2s22p6 , то заполненным оказывается второй слой, L-слой. Это имеет место у атома Ne, он также инертен к химическим реакциям. Таким образом, существование в природе ядер с повышенной энергией связи на один нуклон приводит к тому, что на экспериментальном графике рис. 4.3.1 точки для ядер с заполненными нуклонными оболочками будут расположены выше соответствующих средних
259
значений. Магические числа как раз и свидетельствуют о насыщении связей между нуклонами ядра. 3. Знак ядерных сил зависит от расстояния между нуклонами. Что можно сказать об особенностях сил взаимодействия? Нуклоны наиболее сильно связаны между собой, когда они находятся на расстоянии ≈ 0,5 Ф. При дальнейшем сближении до расстояния 0,2 Ф силы притяжения постепенно сменяются силами отталкивания (рис. 4.4.2). Поэтому нуклоны в ядре находятся на некотором расстоянии друг от друга. В этом состоит одно из характерных отличий ядерных сил от электромагнитных. FЯ
0,2
0,5
1,4 r, Ф
Рис. 4.4.2. Силы взаимодействия между нуклонами 4. Обменный характер сил притяжения Взаимодействие между нуклонами в ядре осуществляется при помощи обмена особыми частицами, которые называются π-мезонами. Поэтому такое взаимодействие носит обменный характер. Здесь наглядную картину можно представить следующим образом: если имеет место взаимодействие между двумя нуклонами, то на языке ядерной физики это означает, что эти два нуклона непрерывно обмениваются между собой другими частицами, которые без нарушения целостности ядра зарегистрировать невозможно. Все π-мезоны, находящиеся в свободном состоянии, подразделяются на три группы, которые отличаются между собой электрическим зарядом, массой и временем жизни, у них барионный заряд отсутствует (В=0): π0, π+, π-. Находясь в свободном состоянии, они имеют следующие свойства: mπ± = 273,2·mе, q = ± e, τ = 2,6·10-8 c, mπ0 = 264,2 me, q = 0 , τ = 1,9·10-16 c.
260
Обменное взаимодействие между двумя нуклонами ядра происходит непрерывно в интервале времени ∆t = 4·10-24 с. Максимальное расстояние, которое за это время пролетает виртуальный π-мезон со скоростью, близкой к скорости света, равно ℓ = 3·108·4·10-24·1015 = 1,2 Ф. Это расстояние сравнимо с радиусом действия ядерных сил. Если два протона, два нейтрона, протон и нейтрон обмениваются 0 π -мезонами, то в этом случае взаимного превращения нуклонов из одного в другой не происходит. Пусть взаимодействие осуществляется при помощи π–-мезонов, тогда нейтрон, испустив π–-мезон, одновременно с этим превращается в протон, а исходный протон, поглотив отрицательный π–-мезон, превратится в нейтрон. Теперь допустим, взаимодействие между протоном и нейтроном осуществляется при помощи π+-мезона. Протон, испустив π+-мезон, превратится в нейтрон, при этом исходный протон, потеряв положительный заряд, также превратится в нейтрон. Итак, процесс взаимодействия между протоном и нейтроном можно наглядно представить таким образом: первоначально протон испускает π+-мезон, π+-мезон за время 4·10-24 с поглощается нейтроном, в результате нейтрон переходит в протонное состояние. Возникший в результате поглощения нейтроном π+-мезона протон вновь испускает π+-мезон и т.д. Значит, в процессе обменного взаимодействия между разноименными нуклонами протоны испускают только π+-мезоны, нейтроны испускают только π–-мезоны, а взаимодействие между одноименными нуклонами осуществляется в результате обмена нейтральными π0-мезонами. Наглядная схема этих процессов приведена на рис. 4.4.3. Здесь π0, π±-мезоны являются квантами ядерного взаимодействия, но способ обмена мезонами – виртуальный.
π+
π0
π−
+
+
+
+
π+
+
π−
+
π0 π0 π0
Рис. 4.4.3. Схема обмена виртуальными мезонами Последовательной теорией электромагнитного взаимодействия является квантовая электродинамика, окончательно сформировавшаяся к началу 50-х гг. ХХ века.
261
Согласно квантовой электродинамике, электрон непрерывно излучает и вновь поглощает виртуальные фотоны; электрон как бы окружен облаком виртуальных фотонов. Электромагнитные взаимодействия электронов и других электрически заряженных частиц рассматриваются как результат обмена виртуальными фотонами. Виртуальные фотоны здесь являются квантами электромагнитного взаимодействия, когда при испускании фотона заряд на некоторое время занимает энергию у себя при условии ее быстрой передачи за счет поглощения этого фотона другим зарядом. Виртуальный процесс обмена фотонами с заимствованием и возвращением энергии происходит за очень короткое время и не поддается измерению. 4.5. Строение атомных ядер
Для построения теории атомного ядра необходимы детальные знания особенностей ядерных сил. Однако в настоящее время у физиков нет еще достаточно точного представления об их природе и свойствах. И то, что о природе ядерных сил до сих пор было рассказано, носит скорее предварительный характер, нежели окончательный. Определенный вклад в понимание структуры и свойств атомных ядер внесло использование различных физических моделей ядер. Как поступают в таком случае? Обычно конструируется такая модель, такие представления, которые в совокупности описывают какието свойства реальных атомных ядер с наибольшей точностью и в то же время вносят физические и математические упрощения в решение поставленной задачи. Любая совокупность таких упрощающих физических предположений, приводящих к физической и математической трактовке задачи о свойствах ядер, и называется моделью ядра. Модель ядра является обобщением тех сведений, которыми располагает физика о свойствах атомного ядра. С этой точки зрения должно быть ясно, что никакая модель ядра не может передать всех свойств атомных ядер. Поэтому всякая модель имеет ограниченную применимость, в природе нет универсальных моделей. Каждую модель с успехом применяют при рассмотрении ограниченного круга ядерных процессов. Достоинство той или иной модели состоит в том, что она дает направляющие идеи для дальнейших исследований, а также возможность объяснить в ядерной физике многие явления, рассматривая их при этом с единой точки зрения.
262
4.5.1. Модель жидкой капли Модель жидкой капли – одна из простейших моделей атомного ядра, которая применима для тяжелых невозбужденных ядер. Модель была разработана в 1936 г. М. Борном. В основе модели лежит представление о том, что благодаря большой плотности упаковки нуклонов в ядре и наличию сильного взаимодействия между ними столкновения между нуклонами происходят настолько часто, что движение отдельных нуклонов оказывается взаимосвязанным, взаимозависимым. Согласно этой модели, ядро представляет собой каплю заряженной жидкости, поверхность которой испытывает волнообразное колебательной движение. Модель жидкой капли имела успех в объяснении многих характерных особенностей ядерных реакций. В 1939 г. на основе этой модели Н. Бору, Д. Уилеру и независимо от них Я.И. Френкелю (г. Ленинград) удалось объяснить деление тяжелых ядер. Успех модели был настолько значительным, что он даже несколько повлиял на дальнейшее развитие теории ядра, задержал появление других теорий и моделей. В чем же состоят основные положения капельной модели ядра? Модель жидкой капли применима для ядер с большим числом нуклонов, A >> 1. Предполагается, что между ядром и каплей жидкости имеется глубокая аналогия. Основанием для такого заключения являются следующие факты. 1. Плотность ядерного вещества постоянна у всех ядер и практически не зависит от размера ядра. Плотность капли жидкости также не зависит от ее размеров. Для доказательства этого утверждения проведем следующие наглядные рассуждения. Если принять, что невозбужденное ядро имеет сферическую форму, то объем ядра должен быть пропорционален общему числу нуклонов А: 4 V = π R 3 = DA, D = const. 3 Плотность ядерного вещества ρ = M Я / V , а его масса M Я ≈ m A ; здесь М – масса ядра, m – средняя масса нуклона. Конечно, плотность ядра несколько зависит от его размеров, от числа нуклонов в ядре, но эта зависимость слабая. С учетом этого mA m ρ= = = const. DA D Таким образом, плотность ядерного вещества практически не зависит от размера ядра, она одинакова у всех ядер. То же самое имеет
263
место и в жидкой капле, где плотность жидкости практически не зависит от размеров капли. Для примера вычислим плотность ядерного -15 вещества у изотопа ядра 238 м. 92 U , радиус ядра которого R = 8·10
ρ=
3m A 4πR
, 3
ρ=
3 ⋅ 1,66 ⋅ 10 −27 ⋅ 238
(
)
−15 3
= 1,84 ⋅ 1017 кг/м 3
4 π 8 ⋅ 10 Мы видим, что плотность ядерного вещества столь велика, что ее даже не с чем сравнивать. Поэтому свойства ядерной материи необычны по сравнению со свойствами вещества макроскопических тел. Физическая причина такого различия в плотности материи макроскопических тел и плотности ядерного вещества достаточно понятна. Она состоит в том, что ядерное вещество сосредоточено в очень малом объеме ядра, за пределами этого объема плотность материи по сравнению с ядерной пренебрежимо мала. В макроскопических телах при определении плотности вещества мы учитываем не только полный объем всех ядер вещества, но и объем, в котором нет ядер, а присутствуют лишь поля различного физического происхождения; но плотность материи в этих полях на много порядков величины меньше ядерной. Так как объем ядер по сравнению с объемом пространства между ядрами очень мал, то и средняя плотность макроскопического вещества всегда оказывается величиной высшего порядка малости относительно плотности ядерной материи. 2. Силы ядерного взаимодействия в какой-то степени напоминают силы межмолекулярного взаимодействия в капле жидкости. Известно, что силы межмолекулярного взаимодействия, приводящие к образованию капли жидкости, обладают малым радиусом действия, они являются короткодействующими. Это означает, что каждая молекула взаимодействует не со всеми молекулами капли жидкости, а лишь с близлежащими. У молекул существует сфера молекулярного действия. Нечто подобное имеет место и в атомных ядрах: силы ядерного взаимодействия являются короткодействующими, способными к насыщению; поэтому каждый нуклон может взаимодействовать с ограниченным числом ближайших к нему нуклонов, устойчивому состоянию должно соответствовать определенное расстояние между нуклонами. В результате, как и в жидкой капле, в ядре возникает поверхностный слой, нуклоны которого находятся в особом состоянии. Невозбужденное ядро в целом ряде случаев должно иметь сферическую форму, а нуклоны поверхностного слоя обладать дополнительной поверхностной энергией, см. рис. 4.5.1.
264
Рис. 4.5.1. Схема капельной модели ядра 3. В капле жидкости силы взаимодействия между молекулами очень велики по сравнению с силами взаимодействия между атомами газа. Поэтому расстояние между молекулами в капле достаточно мало, плотность упаковки очень велика, а средняя длина свободного пробега мала по сравнению с линейными размерами капли. В капельной модели атомное ядро рассматривается как система сильно связанных частиц, поэтому вследствие плотной упаковки нуклонов в ядре средняя длина свободного пробега нуклонов также мала по сравнению с диаметром ядра. В результате, находясь в ядре, нуклоны испытывают непрерывные столкновения друг с другом, а их движение, в общем случае, уже не является независимым. Итак, λ << R, где λ – средняя длина свободного пробега нуклона в ядре, R – радиус ядра. 4. Нуклоны ядра связаны между собой ядерными силами взаимодействия, но при этом нуклоны все время находятся в интенсивном движении, испытывая многочисленные столкновения между собой. Ядро может обладать лишь дискретными значениями полной энергии. В основном, устойчивом состоянии полная энергия ядра минимальна. При получении энергии извне ядро переходит в одно из возбужденных состояний. Но так как нуклоны сильно связаны между собой, то полученная энергия быстро перераспределяется между ними. Возбужденное ядро, как и возбужденная капля жидкости, начинает интенсивно колебаться. Многочисленные столкновения нуклонов могут в какой-то момент времени привести к сосредоточению полученной энергии на одном из поверхностных нуклонов. И если дополнительная энергия больше энергии связи, то нуклон преодолеет силу поверхностного натяжения и вылетит за пределы ядра. Таким образом, по капельной модели выброс нуклона из ядра аналогичен испарению
265
молекулы из капли жидкости. Поверхностный нуклон испаряется из ядра после того, как он поглотит от других нуклонов энергию, достаточную для преодоления силы поверхностного притяжения. Избыточная энергия может сосредоточиться на одном поверхностном нуклоне потому, что число нуклонов даже в тяжелом ядре сравнительно невелико, поэтому с достаточно заметной вероятностью возможны флуктуации энергии, пропорциональные 1/А1/2. Чем больше нуклонов в ядре, тем меньше вероятность возникновения флуктуации, и наоборот. Следовательно, такое ядро должно обладать естественной радиоактивностью. 5. Как в ядре, так и в капле жидкости отсутствует силовой центр. И, тем не менее, невозбужденные ядро и капля имеют сферическую форму. Можно считать, что действие силового центра заменяет силы поверхностного натяжения. Сферическая форма ядра обусловлена тем, что минимальное значение энергии поверхностных нуклонов ядра будет только в случае сферического ядра; у ядер, имеющих форму, отличную от сферической, поверхностная энергия будет значительно большей величины. Отметим теперь те различия, которые существуют между свойствами капли жидкости и свойствами реального ядра. 1. Силы молекулярного взаимодействия имеют электромагнитное происхождение. Ядерные силы – это особый, специфический вид сил, они не могут быть сведены к электромагнитным силам, хотя бы потому, что у них разные механизмы взаимодействия. Ядерные силы существенно отличаются от электромагнитных по зависимости силы взаимодействия от расстояния между нуклонами и некоторыми другими признаками. 2. Движение составных частей капли жидкости может быть описано методами классической физики в рамках представлений динамики сплошных сред. Движение нуклонов в ядре вследствие их сравнительной малочисленности всегда имеет квантовый характер и не может быть описано законами классической физики. 4.6. Формула Вейцзеккера
Важнейшее достижение капельной модели ядра заключается в том, что на основе сравнения с опытом удалось получить формулу для энергии связи нуклонов в тяжелых ядрах, которая хорошо соответствует эксперименту:
266 2
−
1
−
3
ε св = a1 A − a2 A 3 − a3 Z 2 A 3 − a4 ( A − 2 Z ) 2 A−1 + a5 A 4 ⋅ δ (4.6.1) В настоящее время приняты следующие значения постоянных a1 − a5 : a1 =14 МэВ; a2 =13МэВ; a3 = 0,584МэВ; a4 =19 МэВ; a5 = 33,5 МэВ;
⎧+ 1 Z , N - четные, ⎪ δ = ⎨ 0 А - нечетное, ⎪− 1 Z , N - нечетные. ⎩ Формула (4.6.1) впервые была получена Вейцзеккером и дает правильные значения энергии связи более чем для 100 тяжелых ядер, что делает формулу достаточно универсальной и очень ценной при анализе свойств тяжелых ядер. Однако она не применима к легким ядрам и к ядрам с магическими числами нуклонов. Тогда масса ядра с учетом энергии связи, вычисленной по формуле (4.6.1), ε M Я = Z ⋅ m p + N ⋅ mn − св2 (4.6.2) с где m p , mn – соответственно массы протона и нейтрона. Отметим, что формула (4.6.1) не применима к ядрам с массовыми числами A < 100 . Рассмотрим физический смысл каждого из слагаемых формулы (4.6.1). Первое слагаемое в формуле (4.6.1) учитывает объемную составляющую энергии связи. Его происхождение связано с эффектом насыщения ядерных сил, согласно которому каждый нуклон может взаимодействовать лишь с ограниченным числом близлежащих нуклонов ядра. Поэтому при достаточно большом числе нуклонов не все нуклоны вступают во взаимодействие друг с другом, поле ядерных сил одного нуклона не охватывает наиболее удаленные нуклоны. В результате в ядрах с большим числом нуклонов при изменении числа нуклонов полная энергия связи всех нуклонов ядра возрастает пропорционально массовому числу A . Второе слагаемое в формуле (4.6.1) учитывает влияние силы поверхностного натяжения на энергию связи в ядре. Действительно, можно показать, что нуклоны поверхностного слоя ядра в результате притяжения со стороны остальных нуклонов обладают дополнительной энергией, т. е. поверхностной энергией связи, пропорциональной площади поверхности ядра: ε пов = D1S = D1 4π ⋅ R 2 ,
267
где R – радиус ядра, R = D2 Отсюда
1 A3
, D1 , D2 – постоянные коэффициенты. 2
ε пов = a2 A 3 . Третье слагаемое учитывает силы кулоновского отталкивания между протонами. Оказывается, полная энергия кулоновского отталкивания протонов обратно пропорциональна радиусу ядра R и пропор-
циональна квадрату его электрического заряда ( Z ⋅ e) 2 : −
1
ε к = a3 Z 2 A 3 . Четвертое слагаемое называется энергией симметрии. Физическая причина ее возникновения полностью не ясна. По-видимому, возникновение энергии симметрии связано с различной кварковой структурой протонов и нейтронов. Из опыта следует, что ε сим = a4 ( A − 2 Z ) 2 A−1. Пятое слагаемое не может быть объяснено в рамках капельной модели ядра. Но опыт показывает, что энергия связи максимальна для четно-четных ядер, минимальна для нечетно-нечетных и принимает промежуточные значения для остальных ядер. Если предположить, что в ядре протоны объединяются парами, нейтроны объединяются парами, то для четно-четных ядер энергия спаривания будет положительна, для нечетно-нечетных ядер отрицательна, а для ядер только с нечетными значениями массовых чисел A энергия спаривания принимает промежуточные значения. Капельная модель ядра позволяет вычислить массу различных тяжелых ядер, объяснить явления α − и β –распада, физическую причину деления тяжелых ядер. На основе капельной модели ядра можно получить качественное представление об общей структуре распределения уровней полных энергий в ядре. Но капельная модель не позволяет рассчитать возбужденные состояния ядра. Попытка согласовать частоту колебаний волн на поверхности капли ядерной жидкости с соответствующими уровнями полной энергии нуклонов в ядре не привела к успеху. Особенностью капельной модели является хаотичность движения нуклонов в ядре. Это проявляется в том, что в процессе движения нуклоны ядра непрерывно сталкиваются и обмениваются энергией между собой, поэтому нуклоны не могут длительное время находиться в
268
определенном состоянии. Перераспределение энергии при таких столкновениях может в редких случаях привести к передаче какому-то нуклону дополнительной энергии весьма значительной величины. Если это произошло вдали от поверхности, то последующие столкновения приведут к новому перераспределению энергии, результатом которого является потеря нуклоном избыточной энергии. Если же это произошло с одним из нуклонов поверхностного слоя, то всегда существует определенная вероятность такому нуклону покинуть ядро, т.е. "испариться". В качестве примера использования формулы Вейцзеккера вычислим наименьший заряд ядра Z с массовым числом A = 103 , который может иметь один из природных изобаров с таким массовым числом. Так как число нуклонов в ядре A – нечетное, то δ = 0 . Запишем два уравнения для одного и того же значения полной энергии связи в ядре: 2
ε св = a1 A − a2 A 3 − a3 Z 2 A
(
−
1 3
− a4 ( A − 2Z ) 2 A−1 ;
)
ε св = Zm p + ( A − Z )mn − M я ( z ) c 2 . Левые части уравнений одинаковы, поэтому их можно объединить, записав: 2
a1 A − a2 A 3 − a3 Z 2 A
−
1 3
− a4 ( A − 2Z ) 2 A−1 = (Zm p + ( A − Z )mn − M я ( z ) )c 2 .
Для определения наименьшего заряда ядра используем условие экстремума: ⎛ dM я ( Z ) ⎞ =0. ⎜ ⎟ ⎝ dZ ⎠ Z =Z min Тогда − 2a3 Z min A−1 + a4 4( A − 2 Z min ) A−1 = (m p − mn )c 2 .
Отсюда после подстановки соответствующих значений получаем Z = 44,8 ≈ 45 , что соответствует ядру родия 103 45 Rh . 4.7. Мезонная теория ядерных сил
Пусть в пространстве находится точечный электрический заряд. Потенциал электрического поля, созданного таким зарядом, будет q ϕ= . 4πε0ε r
269
Полученный результат носит общий характер, он будет иметь место и для потенциальных полей иной физической природы. Следовательно, каждому полю должен соответствовать свой заряд, носитель этого поля. В 1935 г. для объяснения особенностей действия ядерных сил советский ученый академик И.Е. Тамм высказал предположение, что силы притяжения между нуклонами ядра можно объяснить наличием обменного взаимодействия с помощью электронов. Эта гипотеза в какой-то мере аналогична гипотезе об обменном взаимодействии между ионами металла, приводящая к образованию металлической связи. Однако проведенный расчет не подтвердил количественного соответствия теории опыту. Но соответствующая статья была опубликована, о ней узнала научная общественность как у нас в стране, так и за ее рубежом. В 1936 г. японский физик Юкава, используя результаты работы И.Е. Тамма, для объяснения природы ядерных сил ввел в рассмотрение неизвестную пока в науке частицу π -мезон. При этом он предположил, что поле ядерных сил также потенциально. Каждый нуклон обладает барионным зарядом B , создающим в окружающем пространстве поле ядерных сил. С помощью π - мезонов и осуществляется обменное взаимодействие между ближайшими нуклонами ядра. Таким образом, барионный заряд B в ядерном взаимодействии является аналогом электрического заряда q в электромагнитном взаимодействии. Но так как движение π -мезонов в ядре всегда релятивистское, то для его описания необходимо теперь составить релятивистское уравнение движения. Известно, что формула для полной энергии релятивистской частицы впервые была предложена австрийским физиком Хазенхергеном (см. Реферативный журнал 18. Физика. 1998, №12, стр. 1-2, 12 А8). В дальнейшем эта формула была использована Эйнштейном, но без соответствующей ссылки на первого автора. Итак, полная энергия π -мезона ε = mc 2 . (4.7.1) Импульс π -мезона p = mv . (4.7.2) Подставим значение массы π -мезона из (4.7.2) в (4.7.1): 2m v (4.7.3) a12 = 2α ε или ε = pc . c η
270
Так как масса движущегося π -мезона определяется по формуле Лоренца, то после подстановки значения массы m0 m= (4.7.4) 1
⎛ ⎛ v ⎞2 ⎞ 2 ⎜1 − ⎜ ⎟ ⎟ ⎜ ⎝c⎠ ⎟ ⎝ ⎠
в (4.7.1) получаем 2
2⎛ v ⎞
(
2
)
2
ε − ε ⎜ ⎟ = m0c 2 . (4.7.5) ⎝c⎠ В формуле (4.7.5) m0 – масса покоя частицы. Далее, в (4.7.5) под2⎛ v ⎞
2
ставим значение ε ⎜ ⎟ из формулы (4.7.3): ⎝c⎠
(
)
2
ε 2 = ( pc ) 2 + m0 c 2 . (4.7.6) Запишем правую часть уравнения (4.7.6) в операторной форме:
( ) (
ˆ c2 2 + m c2 ˆ = pρ Φ 0 где
)
2
(
) ( 2
)
2
= − η∇c 2 + m0c 2 ,
ρ pˆ = iη∇.
По определению потенциал π -мезона в поле ядерных сил U ϕπ = π , m0 где U π – потенциальная энергия π -мезона в поле сил одного из нуклонов ядра. Отсюда ˆ ϕ = ⎛⎜ − ηc 2∇ 2 + m c 2 2 ⎞⎟ϕ . Φ 0 π ⎠ π ⎝
(
) (
)
ˆ ϕπ = 0 а так как у π -мезонов барионный заряд отсутствует, то Φ
(
) (
)
⎛⎜ − ηc 2∇ 2 + m c 2 2 ⎞⎟ϕ = 0 0 ⎝ ⎠ π или 2 2⎞ ⎛ ⎜ ∇ 2 − ⎛⎜ m0c ⎞⎟ ⎟ϕ = 0 . ⎜ η ⎟ ⎟ π ⎜ ⎝ ⎠ ⎠ ⎝
271
Обозначим
η = R – радиус действия ядерных сил, тогда m0 c 2
2 1 ⎛ 2 1 ⎞ (4.7.7) ⎜ ∇ − 2 ⎟ϕπ = 0 или ϕ′π′ + ϕ′π − 2 ϕπ = 0 . r R ⎠ R ⎝ Решением уравнения (4.7.7) является A ⎛r⎞ (4.7.8) ϕπ = exp⎜ ⎟ , r ⎝ R⎠ где A – постоянная интегрирования. Следовательно, масса π -мезона η m0 = 2 . (4.7.9) Rc Из (4.7.6) и (4.7.8) находим силу, действующую на нуклон со стороны π -мезона (силу ядерного взаимодействия): r
Fя = −
1 ⎞ dU π ⎛ 1 = − m0 A⎜ − 2 + ⎟e R , dr rR ⎠ ⎝ r
(4.7.10) r mA ⎛ 1 1 ⎞ R Fя = ⎜ − + ⎟e . r ⎝ r R⎠ Здесь возможны три случая: 1. r = R , Fя = 0 , 2. r < R , Fя > 0 , (сила отталкивания), 3. r > R , Fя < 0 , (сила притяжения). Если в (4.7.9) положить R = 1,4 Ф , то масса виртуального π -мезона m0 = 275,6 ⋅ me . Эксперимент дает следующий результат: mπ ± = 273,2 m , τ = 2,6 ⋅ 10 −8 c , q = ± e ;
mπ 0 = 264,2 me , τ = 1,6 ⋅ 10 −16 c , q = 0 , где me – масса покоя электрона. Следовательно, на расстоянии r < R между нуклонами ядра происходит обмен π± - мезонами, ибо, согласно (4.7.9), чем больше mπ ± , тем меньше радиус ядерного взаимодействия R . На расстояниях r > R обмен между нуклонами происходит преимущественно π0 - мезонами, у которых mπ 0 < mπ ± . Как следствие этого, радиус действия ядерных сил увеличивается.
272
В заключение отметим основные особенности мезонной теории ядерного взаимодействия. Достоинства теории: 1. объясняет физическую причину наличия короткодействия ядерных сил, а также знакопеременность действия ядерных сил; 2. объясняет причину независимости действия ядерных сил от величины и знака электрического заряда; 3. достаточно проста и наглядна. Недостатки теории: 1. не объясняет физическую причину возникновения сил отталкивания между нуклонами на расстояниях, меньших 0,2Ф; 2. не объясняет физическую причину насыщения ядерных сил; 3. не учитывает влияние спина нуклона на особенности взаимодействия между ними. За создание теории ядерного взаимодействия Юкава в 1949 г. получил Нобелевскую премию. 4.8. Модель ядерных оболочек
Модель ядерных оболочек применима для неколлективных невозбужденных ядер с любым числом нуклонов в ядре. Она хорошо объясняет: 1. физический смысл магических чисел нуклонов в ядре, 2. эффект насыщения ядерных сил, 3. особенности заполнения нуклонных оболочек в ядре, 4. физическую причину стабильности ядер. В этой модели используются следующие предположения. 1. Каждый нуклон находится в самосогласованном поле ближайших нуклонов ядра. 2. Нуклоны ядра участвуют в орбитальном движении вокруг центра ядра, несмотря на отсутствие в нем силового центра. Действие не существующего в ядре силового центра заменяют силы поверхностного натяжения. 3. Энергия нуклонов в ядре дискретна, т.е. она квантуется. 4. Каждый нуклон имеет орбитальный и собственный моменты импульсов, а также собственный магнитный момент. Заметим, наличие собственного магнитного момента у нейтрона можно объяснить неравномерным по объему распределением электрического заряда. Это связано с тем, что нейтрон состоит из трех кварков, пространственно по-разному расположенных в нем.
273
5. Между соседними нуклонами существует спин-орбитальное взаимодействие. 6. Нуклон представляем в виде тороида, вращающегося вокруг оси симметрии с большой угловой скоростью. Из мезонной теории ядерных сил следует, что ядерные силы являются короткодействующими, они обладают свойством насыщения. Поэтому каждый нуклон может взаимодействовать лишь с ограниченным числом нуклонов ядра, с несколькими соседними нуклонами. Так как все нуклоны находятся в непрерывном движении, то каждый нуклон относительно соседнего нуклона будет перемещаться с мгновенρ ной скоростью υ , поэтому относительно мгновенного центра ядра он ρ будет обладать мгновенным орбитальным моментом импульса Ll и ρ собственным моментом импульса Ls . Кроме того, нуклон как система ρ кварков должен обладать собственным магнитным моментом pms и при орбитальном движении будет создавать соответствующее магнитρ ное поле Bl . В результате каждый из нуклонов ядра будет обладать энергией спин-орбитального взаимодействие, физическая причина возникновения которого была разъяснена ранее на примере объяснения происхождения энергии спин-орбитального взаимодействия валентного электрона атома. Сказанное в равной степени относится как к протону, так и к нейтрону. Как было показано ранее, энергия спин-орбитального взаимодействия у каждого нуклона ядра определяется выражением ρ ρ ∆W = − pms ⋅ Bl . (4.8.1) Собственный магнитный момент нуклона ρ ρ pms = −2 gLs . Магнитное поле, созданное нуклоном в результате орбитального движения всех нуклонов ядра, ρ ρ µ ρ Be ≈ 0 3 pml = γ pml 2π r Орбитальный магнитный момент нуклона ρ ρ pml = − gLl , ρ e ρ где g = , Ls – собственный момент импульса, Ll – орбитальный моm мент импульса, g – гиромагнитное отношение нуклона. После подстановки найденных значений в (4.8.1) получаем:
274
ρρ ∆W = −2 g 2 γ Ls Ll .
(4.8.2) ρ ρ Теперь найдем скалярное произведение векторов Ll ⋅ Ls . Так как полный момент импульса нуклона ρ ρ ρ L j = Ll + Ls , то
ρ ρ ρ ρρ L2j = L j ⋅ L j = L2j = L2l + 2 Ll Ls + L2s
или
ρρ 1 Ll Ls = ( L2j − L2l − L2s ), (4.8.3) 2 где j – внутреннее квантовое число. Полный, орбитальный и собственный моменты импульсов по одному и тому же закону зависят от соответствующих квантовых чисел: ρ ρ ρ (4.8.4) L2j = η2 j ( j + 1) , Ll2 = η2l (l + 1) , L2s = η2 s ( s + 1) .
После подстановки значений (4.8.4) в (4.8.3) получаем: ρ ρ η Le ⋅ Ls = ( j ( j + 1) − l (l + 1) − s ( s + 1) ) . (4.8.5) 2 В общем случае внутреннее квантовое число 1 j=l±s=l± . 2 Подставим в формулу (4.8.2) следующие значения внутренних квантовых чисел:
j1 = l +
1 . 2
Тогда
1 3⎞ 3 1 ⎛ ∆W1 = g 2η2 γ ⎜ (l + )(l + ) − l (l + 1) − ⋅ ⎟ = g 2η2 γ l . 2 2⎠ 2 2 ⎝ 2 Обозначим ⎧∆W0 = g 2η2 γ ⎪ (4.8.6) ⎨∆W1 = l ⋅ ∆ W0 . ⎪⎩ 2 Далее при 1 j2 = l − 2
275
∆W
1 − 2
1 1 ⎞ 1 1 ⎛ = g 2η2 γ ⎜ (l − )(l + ) − l (l + 1) + ⋅ ( ) ⎟ = −l∆W0 2 2 ⎠ 2 2 ⎝ ∆W
−
1 2
= −l∆W0 . ∆W
±
(4.8.7)
1 2
λ
j
0
±1 2
0
s1
1
±1 2 , 32
1, − 1
p1 , p3
T
∆W0
2
2
2
2
3 2, 52
2, − 2
d3 ,d5
3
5 2, 7 2
3, − 3
f5 , f7
2
2
2
2
Таблица 4.8.1. Энергии спин-орбитального взаимодействия для различных значений орбитальных квантовых чисел В табл. 4.8.1 приведены относительные значения энергии спинорбитального взаимодействия ∆W 1 для различных значений орби±
2
тальных квантовых чисел и соответствующие обозначения термов нуклонов в ядре. Из табл. 4.8.1 видно, что каждый терм расщепляется на два, причем величина относительного расщепления
∆W
±
1 2
∆W0
равна квантовому числу
λ ; чем больше λ , тем больше будет величина расщепления. В модели ядерных оболочек последовательное заполнение состояний нуклонами происходит по воображаемым нуклонным оболочкам. В заполненной оболочке нуклоны наиболее прочно связаны между собой. Всего в ядре может быть не более 7 нуклонных оболочек, каждая из них характеризуется определенным набором термов. В табл. 4.8.2 приводятся первые пять ядерных оболочек, а также число нукло-
276
нов, заполняющих каждую из них, и магические числа нуклонов для каждой из оболочек. Цифры 1 и 2 перед термами обозначают номера уровней. При наличии в ядре полностью заполненных одной или нескольких нуклонных оболочек ядро оказывается особенно устойчивым, а следовательно более стабильным относительно радиоактивного распада, у таких ядер энергия связи является наибольшей по сравнению с энергией связи у ядер с незаполненными нуклонными оболочками. № оболочки
T
I
1s 1
II
1 p 3 ,1 p 1
III
1d 5 ,1d 3 , 2s 1
IV
1 f7
V
2
2
2
2
2
1 f 5 , 2 p 3 , 2 p 1 , 1g 9 2
2
N
2
2
4+2=6
2+6=8
6 + 4 + 2 = 12
2
2 2
Nj
2
2 + 6 + 12 = 20
8
20 + 8 = 28
6 + 4 + 2 + 10 = 22
28 + 22 = 50
Таблица 4.8.2. Конфигурация первых пяти ядерных оболочек ( T – условное обозначение терма с указанием внутреннего квантового числа; N j – число нуклонов в заполненной нуклонной оболочке; N – магическое число нуклонов в ядре) Модель ядерных оболочек позволяет выявить существующие в природе стабильные ядра. Если за наиболее вероятное значение магического числа в VII протонной оболочке принять Z = 126 , а в VIII нейтронной оболочке N = 240 , то, по-видимому, ядра с указанными чис366 лами нуклонов 126 X должны обладать повышенной стабильностью и необычными физическими свойствами. Опыт показывает, что после изотопа 208 82 Pb все более тяжелые изотопы, полученные искусственным путем, являются нестабильными, у них с увеличением массового
277
числа A период полураспада постепенно уменьшается. Тогда по мере приближения к изотопам с массовыми числами A = 366 должен увеличиваться период полураспада. Однако изотопы с указанными массовыми числами в настоящее время получить весьма проблематично. Один из таких "островков" стабильности в слабом его проявлении на260 Lr , что видно из табл. 4.8.3. блюдается у трансуранового элемента 103 A Z
X
T1 2
254 99
Es
1,3 года
257 100
Fm
100 дней
258 101
Md
56 дней
259 102
No
58 мин
260 103
Lr
90 дней
261 104
Ku
65 с
262 105
Ns
34 с
Таблица 4.8.3. Стабильность некоторых изотопов Остановимся вкратце на предсказаниях модели ядерных оболочек относительно возможных спинов четно-четных ядер в основном состоянии. При застройке оболочек нуклоны объединяются в пары с противоположной ориентацией их собственных моментов импульса ρ Ls . Поэтому основное состояние всех ядер с четным числом протонов и четным числом нейтронов не должно иметь результирующего собственного момента импульса, отличного от нуля. Это полностью соответствует опыту. Отсюда получается, что собственный момент импульса, собственный магнитный момент у таких ядер отсутствует. Как следует из опыта, ядра, состоящие из четно-нечетных или нечетночетных протонов и нейтронов, имеют суммарное спиновое квантовое число 1 j = N + , N ≤ 6. 2 Таким образом, спиновое квантовое число ядра j в основном со1 стоянии либо кратно , либо равно 0 . 2 Область применения модели ядерных оболочек ограничена описанием ядер, находящихся в основном или слабо возбужденном состояниях. Нами довольно подробно рассмотрены две модели ядра. Но существуют и другие модели ядра, например, обобщенная модель ядра, которая дает правильное описание свойств некоторых ядер. В этой модели предполагается, что нечетный нуклон движется в поле аксиальной симметрии, образованной всеми нуклонами остова. В какой-то
278
степени эта модель напоминает атом щелочноземельного элемента. Более подробное изложение этой и других моделей ядра (модель парных корреляций, статистическая модель и др.) выходит за пределы курса общей физики высшей школы. 4.9. Направленность радиоактивных превращений
Из опыта известно, что в природе совершенно не встречаются ядра атомов, состоящие только из протонов, кроме ядра H , или только из нейтронов, хотя неоднократно подчеркивалось, что ядерные силы притяжения между p-p, n-n, p-n совершенно одинаковы. Так в чем же здесь дело? Опыт показывает, что свободных нейтронов в природе не существует: раз возникнув, они через некоторое время распадаются. Таким образом, свободный нейтрон является радиоактивной частицей и, следовательно, имеет ограниченное время жизни. Иными словами, энергетический уровень свободного нейтрона всегда располагается выше энергетического уровня свободного протона, поэтому реакция распада свободного нейтрона всегда идет с выделением энергии Q : n = p + 0e+ 0v~ + Q , −1
0 e
Q = 0,79 МэВ , Tn = 11,7 мин , Tp = ∞ , Tn и Tp – соответственно время
жизни нейтрона и протона в свободном состоянии. Переход нейтрона в протон сопровождается испусканием электрона и электронного антинейтрино, их появление вызвано тем, что при переходе нуклона из нейтронного в протонное состояние должны выполняться законы сохранения электрического, барионного и лептонного зарядов, а также закон сохранения энергии. В самом деле, если нуклон перешел из нейтронного состояния в протонное, то у нуклона в протонном состоянии возникает положительный заряд, и для его компенсации необходимо, чтобы в процессе распада появилась частица, компенсирующая этот заряд. Такой частицей является электрон. Но электрон принадлежит к классу лептонов, он, кроме электрического заряда, имеет еще лептонный заряд. Для компенсации положительного лептонного заряда электрона должна возникнуть частица с отрицательным лептонным зарядом. Такой частицей является электронное антинейтрино 00 v~e . На рис. 4.9.1 представлена схема радиоактивного распада свободного нейтрона.
279
ε
n
−1
e + v~e
p
Рис. 4.9.1. Схема радиоактивного распада свободного нейтрона Рассмотрим особенности заполнения уровней полных энергий протонами и нейтронами в ядре, используя модель ядерных оболочек. В этой модели предполагается независимое друг от друга движение нуклонов в потенциальной яме самосогласованного поля ядра, потенциал поля не вычисляется, а подбирается и зависит от расстояния до центра ядра. Потенциал подбирается таким, чтобы имело место наилучшее согласие с опытом. В соответствии с моделью ядерных оболочек на рис. 4.9.2 приведена эмпирическая последовательность расположения нуклонных уровней в ядре без учета электромагнитного взаимодействия между протонами. Изображенные на рис. 4.9.2 уровни полной энергии нуклонов являются вырожденными. Кратность вырождения N определяется значениями квантового числа j =l+s, где l , s – орбитальное и спиновое квантовые числа, и вычисляется по формуле N = 2 j +1 . Так как при построении уровней электромагнитное взаимодействие между протонами не учитывалось, то протонные и нейтронные уровни изображены совпадающими. В табл. 4.9.1 приводится распределение нуклонов в стабильных ядрах по состояниям, в том числе и в ядрах с магическими числами 2, 8, 20, 28, 50, в модели ядерных оболочек с учетом изменения энергии протонов из-за их электромагнитных взаимодействий. В результате при большом числе протонов протонные уровни должны располагаться выше соответствующих нейтронных. При малом числе протонов кулоновские силы отталкивания незначительно увеличивают полную энергию взаимодействия. Однако при возрастании числа протонов с
280
Z > 20 кулоновские силы начинают играть все более заметную роль, и компенсация расталкивающего действия кулоновских сил теперь происходит за счет увеличения дополнительного числа нейтронов и, следовательно, увеличения сил ядерного притяжения. Стало быть, в стабильных ядрах, Z > 20 , как правило, число нейтронов всегда должно быть больше числа протонов. Содержание табл. 4.9.1 подтверждает указанный вывод. ε
Nm
11 2
126
1i 12
3p
32
2f
13 2 52
72 92
1h
82 3s
12
2d
1g
28
2p 1f
32
11 2
52
72
12 32
9 2
52 7 2
20
32
1d
2s 8 1p 2
1s
12
52
12 32 12
Рис. 4.9.2. Расположение нуклоных уровней в ядре ( ε – полная энергия ядерного взаимодействия между нуклонами, N m – магические числа нуклонов в ядре)
281 Nm
2
X
Np
Nn
1 1
H
1s 1
-
2 1
H
1s 1
3 2
He
2 × (1s 1 )
1s 1
4 2
He
2 × (1s 1 )
2 × (1s 1 )
6 3
Li
2 × (1s 1 ) ,1 p 3
7 3
Li
2 × (1s 1 ) ,1 p 3
9 4
Be
2 × (1s 1 ) , 2 × (1 p 3 )
2 × (1s 1 ) , 3 × (1 p 3 )
B
2 × (1s 1 ) , 3 × (1 p 3 )
2 × (1s 1 ) , 3 × (1 p 3 )
B
2 × (1s 1 ) , 3 × (1 p 3 )
2 × (1s 1 ) , 4 × (1 p 3 )
12 6
C
2 × (1s 1 ) , 4 × (1 p 3 )
2 × (1s 1 ) , 4 × (1 p 3 )
13 6
C
2 × (1s 1 ) , 4 × (1 p 3 )
2 × (1s 1 ) , 4 × (1 p 3 ) ,1 p 1
A Z
10 5 11 5
8
2
1s 1
2 2
2
2
2
2
2
2
2 × (1s 1 ) ,1 p 3 2
2
2
2 × (1s 1 ) , 2 × (1 p 3 ) 2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
14 7
N
2 × (1s 1 ) , 4 × (1 p 3 ) ,1 p 1
15 7
N
2 × (1s 1 ) , 4 × (1 p 3 ) ,1 p 1
16 8
O
2 × (1s 1 ) , 4 × (1 p 3 ) , 2 × (1 p 1 )
17 8
O
2 × (1s 1 ) , 4 × (1 p 3 ) , 2 × (1 p 1 ) 2 × (1s 1 ) , 4 × (1 p 3 ) , 2 × (1 p 1 ) ,1d 5
2
2
2
2
2
2
2
2 2
2
2 × (1s 1 ) , 4 × (1 p 3 ) , 2 × (1 p 1 ) 2
2
2
2
2 × (1s 1 ) , 4 × (1 p 3 ) , 2 × (1 p 1 )
2 2
2
2
2 × (1s 1 ) , 4 × (1 p 3 ) ,1 p 1
2
2
2
2
2
2
2
20
40 20
... , 6 × (1d 5 ) , 2 × (2 s 1 ) , 4 × (1d 3 ) ... , 6 × (1d 5 ) , 2 × (2 s 1 ) , 4 × (1d 3 )
28
58 28
... , 8 × (1 f 7 )
... , 8 × (1 f 7 )
50
120 50
... , 4 × (2 p 3 ) , 6 × (1 f 5 ) ,
..., 4 × (2 p3 ) , 6 × (1 f 5 ) ,10× (1g 9 ) ,
10 × (1g 9 ) , 2 × (2 p 1 )
2 × (2 p 1 ) , 8 × (1g7 ) , 6 × (2d 5 ) ,12× (1h11 ) ,
Ca Ni Sn
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
4 × (2d 3 ) , 2 × (3s 1 ) ,10× (1h9 ) ,8 × (2 f 7 ) , 2
2
2
2
6 × (2 f 5 ) , 4 × (3 p9 ) ,10× (1i13 ) 2
2
2
Таблица 4.9.1. Распределение нуклонов в ядрах по состояниям
282
В табл. 4.9.1 обозначено: N m – магические числа протонов; N p , N n – соответственно, числа протонов и нейтронов в ядрах; × – знак
умножения,
2 × (1s 1 ) = 1s 1 ,1s 1
например,
2
2
2
или
4 × (1 p 3 ) = 1 p 3 , 1 p 3 , 1 p 3 , 1 p 3 . ) 2
2
2
2
2
Пусть по какой-то причине число нейтронов N в ядре оказалось больше числа протонов Z , соответствующих стабильному состоянию ядра. Это означает, что отношение N Z возросло по сравнению с N Z , характерным для стабильных изотопов. Уменьшить эту величину до значения N/Z у стабильных изотопов можно путем уменьшения числа нейтронов в ядре. Значит, в ядре должен произойти переход одного нуклона из нейтронного в протонной состояние (см. рис. 4.9.3, а). При этом будут испускаться кванты энергии −10 e+ 00v~e . Если же ядро пересыщено протонами, то будет иметь место переход одного из протонов ядра в нейтрон с испусканием кванта энергии 0 0~ − +1 e + 0 ve (см. рис. 4.9.3, б). В первом случае возникает −1 e = β распад, во втором случае возникает ε
p
−1
e + v~e
n
+1
e = β + распад. ε
n
p +1
e + ve
Рис. 4.9.3. Схемы переходов: а – из нейтронного в протонное состояние, б – из протонного в нейтронное состояние Таким образом, опыт показывает, у самых легких стабильных ядер, у которых Z ≤ 20 , отношение N Z ≈ 1 , т.е. число протонов примерно
283
равно числу нейтронов. Но с возрастанием Z отношение N Z постепенно увеличивается, и у тяжелых стабильных ядер, например, у таких, как 208 82 Pb , оно достигает величины, примерно равной 1, 537. Из анализа экспериментальных данных также следует, что для стабильных или долго живущих ядер справедлива следующая эмпирическая формула: N Z = a0 + a1Z + a2 Z 2 + a3 Z 3 , (4.9.1) где a0 = 0,8178, a1 = 0,0166, a2 = −1,552⋅10−4 , a3 = 7,279 ⋅ 10−7 , причем 10 < Z < 126 . Формула (4.9.1) позволяет вычислить число нейтронов в ядре при Z = 126 и тем самым предсказать "островок" стабильности, который, несомненно, должен существовать у некоторых трансурановых элементов. Ядра таких элементов должны иметь повышенную стабильность относительно спонтанного деления и -распада. 4.10. Радиоактивность
В природе существуют стабильные и радиоактивные ядра атомов. Особенностью радиоактивных ядер является самопроизвольный их распад с испусканием одной или нескольких частиц. В процессе распада у ядра могут измениться как зарядовое Z , так и массовое A числа. Радиоактивность ядер, существующих в природных условиях, называют естественной. Радиоактивность ядер, синтезированных с помощью ядерных реакций в лабораториях, называют искусственной. Различия в естественной и искусственной радиоактивности не существует, законы радиоактивности у них одинаковы. Основными характеристиками радиоактивного распада являются: время протекания (период полураспада), тип испускаемых частиц, энергия частиц – продуктов распада, направления вылета частиц – продуктов распада. К числу радиоактивных процессов относятся: 1) α - распад; 2) β − - распад; 3) β + - распад; 4) e -захват; 5) γ - излучение ядер; 6) спонтанное деление тяжелых ядер.
284
4.10.1 Закон радиоактивного распада Радиоактивный распад ядер протекает самопроизвольно без всякого внешнего воздействия. Это процесс статистический, и для отдельно взятого ядра можно лишь указать вероятность его распада в данный момент времени. Однако закономерность в распаде большего числа ядер вскрывается лишь через случайность каждого из них. Основной характеристикой радиоактивного распада является постоянная распада λ . Постоянная распада λ – это есть вероятность распада ядра за 1 с. Важнейшей особенностью радиоактивного распада является независимость постоянной распада от времени. Пусть dw – вероятность распада за время dt . Тогда dw = λdt . Число распавшихся ядер за время dt будет dN = − Ndw , N – число нераспавшихся ядер в момент времени t . Подставим вместо dw найденное выше значение: dN = −λNdt , (4.10.1.1) знак (−) означает, что в процессе радиоактивного распада число материнских ядер убывает. Из (4.10.1.1) следует N = N 0 ⋅ e − λt ,
N 0 – число исходных ядер в начальный момент времени. Уравнение (4.10.1.2) называется законом радиоактивного распада. Введем понятие активность препарата a , определив его как число распадов ядер за 1 с: dN a=− = λN 0 ⋅ e − λt = λN (4.10.1.3) dt [a ] = распад/с = Беккерель = Бк ; 1Бк = 1 распад/с. В настоящее время кроме единицы активности, используемой в СИ, Беккерель, широко применяется внесистемная единица активности Кюри . По первоначальному определению 1 Кюри - это активность 1г изотопа радия 226 88 Ra . Однако для удобства измерений это определение в дальнейшем было заменено: 1 Ки = 3, 700 ⋅ 1010 распад/с . Таким образом, активность 1 Кюри =1 Ки есть активность нуклида, в котором за время 1с происходит 3, 700 ⋅ 1010 актов распада.
(4.
285
Из (4.10.1.2) и (4.10.1.3) следует, что активность препарата со временем убывает по экспоненциальному закону, значит, и масса данного препарата убывает по экспоненциальному закону. Теперь предположим, что препарат состоит из смеси двух радиоактивных нуклидов, причем второй изотоп возникает в результате распада первого. Запишем дифференциальные уравнения, описывающие в препарате распад первого и второго нуклидов: dN1 = −λ1 N1dt , ⎫ (4.10.1.4) ⎬ dN 2 = λ1 N1dt − λ 2 N 2 dt.⎭
Второе дифференциальное уравнение системы уравнений (4.10.1.4) описывает изменение числа вторичных дочерних ядер в процессе радиоактивного распада, причем первое слагаемое в нем отображает прирост вторичных дочерних радиоактивных ядер в результате распада первичных ядер, т.е. число первичных распавшихся ядер за время dt , второе слагаемое равно числу вторичных дочерних ядер, выбывших из препарата за время dt . Решения дифференциальных уравнений (4.10.1.4) имеют вид: ⎫ N1 = N10 ⋅ e − λ1t , ⎪ λ1 N1 − λ 2t − ( λ 2 − λ1 )t ⎬, (4.10.1.5) 1− e N 2 = N 20 ⋅ e + ⎪ λ 2 − λ1 ⎭ где N10 , N 20 – первоначальное число материнских и дочерних радиоактивных ядер. Если λ 2 >> λ1 и N 20 = 0 , то λN N 2 ≈ 1 1 1 − e−λ 2t (4.10.1.6) λ2
(
(
)
)
Тогда при λ 2t > 4,5 из (4.10.1.6) получаем λ1 N1 = λ12 N 2 ,⎫ (4.10.1.7) ⎬. a1 = a2 . ⎭ Уравнение (4.10.1.7) называется вековым уравнением равновесия. Физический смысл его ясен из следующего. Так как λN = a есть число распадов за 1с, то уравнение (4.10.1.7) означает, что число распадов ядер материнского вещества за 1с равно числу распадов ядер дочернего вещества за 1с.
286
Вековое уравнение широко используется для определения периода полураспада T1 . Но при этом следует помнить, что оно справедливо 2
лишь тогда, когда период полураспада материнских ядер много больше периода полураспада дочерних ядер и, кроме того, N 20 = 0 . Если в препарате происходит ряд последовательных радиоактивных превращений, то с учетом указанных выше ограничений вековое уравнение можно продолжить, записав λ1 N1 = λ 2 N 2 = ... = λ n N n . (4.10.1.8) Конечным продуктом цепочки радиоактивных превращений всегда является стабильный изотоп, который накапливается в препарате по мере распада материнского вещества. По величине начального и конечного (стабильного) вещества можно определить возраст горных пород, в которых эти вещества содержатся. Рассмотрим примеры, поясняющие практическую значимость уравнения (4.10.1.8). 1. Необходимо определить возраст минерала, в котором на три 206 атома 238 92 U приходится один атом изотопа свинца 82 Pb , считая, что в начальный момент времени в составе минерала указанный изотоп 9 свинца отсутствовал. У 238 92 U период полураспада T1 = 4,5 ⋅ 10 лет, он 2
на несколько порядков величин превышает периоды полураспада всех остальных нуклидов радиоактивного семейства 238 92 U . Поэтому с большой точностью можно считать, что
238 92 U
непосредственно пре-
238 вращается в 206 82 Pb . Тогда число материнских ядер 92 U , которые в данный момент времени сохранились в горной породе, будет N1 = N10 ⋅ e − λ1t , где 0,693 λ1 = . T1
2
Число вновь образовавшихся ядер 206 82 Pb равно N 2 = N10 − N1 . Отсюда N1 N1 N 2 = = 3 или N10 N1 = 4 3 . N10 − N1 С другой стороны, отношение N10 N1 = e λ1t . Тогда
287
ln 4 − ln 3 4,5 ⋅ 109 = 1,9 ⋅ 109 лет . 0,693 Именно таким способом определяется возраст пород, когда необходимо проследить различные фазы геологической жизни минералов, входящих в состав горной породы. 2. Метод определения даты археологических раскопок. При изучении событий прошлого археологам важно правильно установить, к какому периоду развития человеческого общества относится та или иная археологическая находка. Археологи умеют это определять по письменным источникам, по последовательности наслоений пластов земли, содержащих остатки древней культуры, по рисункам годичных колец на срезах стволов деревьев, использованных для древних построек. Но перечисленные выше методы не всегда дают однозначный количественный ответ в абсолютной форме. В 1948 г. американский ученый Либби предложил радиоуглеродный метод хронологической маркировки ископаемых находок органического происхождения. Такой способ хронологической маркировки получил название радиоуглеродного метода. В 1960 г. за разработку этого метода ему была присуждена Нобелевская премия по физике. Идея радиоуглеродного метода заключается в измерении остаточной радиоактивности найденного предмета и сравнения ее с некоторым стандартным значением. Чем сильнее такое различие, тем древнее предмет. Известно, что в процессе обмена веществ растение усваивает из воздуха углекислый газ CO2 . Основная часть углерода, входящая в состав углекислого газа, представлена стабильными изотопами углерода 126C (99%) и 136C ( ≈ 1%). t=
Однако, кроме них, в составе CO2 имеется незначительная примесь радиоактивного изотопа 146C ( 10−10 %). Этот изотоп возникает в атмосфере благодаря ядерной реакции 14 1 14 1 7 N + 0 n→ 6 C +1 p , причем нейтроны, необходимые для этой реакции, появляются в атмосфере за счет процессов, вызываемых космическими протонами. В результате изотоп 14С усваивается растениями вместе с основными изотопами 126C и 136C . А так как содержание изотопа 146C в атмосфере с течением времени практически не меняется, а если меняется, то оно
288
легко учитывается, то и процентное содержание изотопа 146C в живом растении также является практически неизменным. Так, 1 г углерода в древесине живого растения содержит сегодня примерно такое же количество изотопа 146C , как, скажем, 10000 лет назад. Это обстоятельство и позволяет располагать археологические находки во времени. Рассмотрим конкретный пример. Активность изотопа 146C , содержащегося в деревянном предмете, составляет 0,6 активности того же изотопа в свежесрубленном дереве: a1 (t0 + ∆t ) λN1 N1 = = = 0,6 . a2 (t0 ) λN 2 N 2 Изотоп 146C испытывает β − -распад, T1 = 5570 лет: 2
C ⎯⎯→ N + −10e+ 00v~e .
14 6
β−
14 7
Тогда ln 0,6 a1 N10e − λ (t 0 + ∆t ) = = e − λ∆t = 0,6 , ∆t = − ; ∆t = 4106 лет. − λt 0 a2 λ N10e Таким методом можно определить дату события, если при археологических раскопках найдены деревянные предметы того времени, которые могут быть использованы для хронологических исследований. 4.10.2. α - распад α - распадом называется самопроизвольный процесс испускания ядрами α - частиц, при котором материнское ядро ZA X превращается в
дочернее ядро ZA −−42Y . Распад протекает по схеме ZA X → ZA −−42Y + 24He . Необходимое условие энергетической возможности α - распада состоит в том, что масса материнского ядра должна быть больше общей массы дочернего ядра и α -частицы. Предполагается, что α - частица образуется внутри ядра ZA X еще до момента возникновения распада и некоторое весьма малое время существует в нем самостоятельно. Согласно капельной модели, невозбужденное ядро имеет сферическую форму, на нуклоны ядра действуют ядерные силы притяжения, преобладающие над расталкивающим действием кулоновских сил между протонами. Но за пределами ядра на вылетевшую α -частицу действует только кулоновская сила отталкивания.
289
Пусть до столкновения нуклоны в ядре находились в основном, т.е. невозбужденном состоянии, и поэтому занимали нижние уровни полной энергии (см. рис. 4.10.2.1). После одновременного столкновения двух протонов и двух нейтронов в ядре возникает α -частица, у которой оказываются полностью заполненными первые протонная и нейтронная ядерные оболочки, при этом высвобождается дополнительная энергия, равная дефекту массы. В результате α -частица может занять один из свободных уровней полной энергии ε1 , ε 2 , ε3 . U , МэВ 10 5
ρ
ρ
υα
ε3
0
0,5
−5
ε1 − 10
υα
ε2
1,0
y1
1,5
2,0
y1 =
2,5
3,0
y
R1 R ,y = 1 Rя Rя
− 15 − 20
− 60
Рис. 4.10.2.1. Уровни полной энергии ядра Так как α -частица представляет собой ядро атома 24 He 2 , то дефект массы, возникший при образовании α -частицы, будет ∆m = 0,029267 а.е.м., что эквивалентно выделяемой энергии ∆ε = 27,25 МэВ. Возникшая α -частица находится в поле ядерных сил притяжения нуклонов и отталкивания протонов. Обладая энергией возбуждения, частица в ядре непрерывно сталкиваются как с нуклонами ядра, так и со стенкой потенциальной ямы. Если толщина потенциальной ямы
290
бесконечно велика, то процесс будет продолжаться до тех пор пока α -частица не распадется на составляющие ее нуклоны. Этому процессу соответствует энергия ε1 , в ядре не происходит α -распад. Если энергия α - частицы ε > 0 , то ядерные силы не в состоянии удержать в ядре образовавшуюся α -частицу. Первоначально возникнув, она под действием сил кулоновского отталкивания вылетит за пределы ядра, при этом в пространстве возникнут две частицы: дочернее ядро и α - частица. И хотя вероятность такого распада очень мала, но все же она отлична от нуля. Здесь могут встретиться два случая: 1. Энергия α - частицы ε 3 < U max . На пути движения α - частицы находится потенциальный барьер конечной весьма малой толщины. Поэтому всегда существует заметная вероятность преодолеть его при помощи туннельного эффекта. Итак, в результате одного из таких удачных столкновений α - частица может преодолеть потенциальный барьер туннельным способом. Следовательно, за пределами ядра α частица должна иметь ту же энергию, что и в материнском ядре перед столкновением с потенциальным барьером. А так как внутри ядра уровни полной энергии квантованы, то и за пределами ядра α частицы должны обладать дискретными значениями полной энергии. Опыт подтверждает эту точку зрения. Состояния с такими значениями энергии называются метастабильными. Из рис. 4.10.2.1 следует, что чем больше энергия ε3 , тем меньше должна быть толщина потенциального барьера и тем больше вероятность возникновения α - распада. 2. Энергия α - частицы ε 2 > U max . В этом случае α - частица покидает материнское ядро классическим способом, но энергия α частицы по-прежнему дискретна. Однако на осуществление такого процесса необходима слишком большая энергия возбуждения, поэтому вероятность такого процесса весьма мала. Вылетевшая за пределы материнского ядра α -частица теперь находится в поле короткодействующих ядерных сил притяжения и расталкивающих кулоновских сил протонов дочернего ядра. Но вблизи дочернего ядра электрические силы, действующие на α -частицу, не являются строго кулоновскими, ведь теперь взаимодействие α частицы происходит не с точечным зарядом дочернего ядра и даже не с его сферически распределенным электрическим зарядом, а с объемным зарядом дочернего ядра, форма которого в результате взаимодействия с электрическим зарядом α - частицы несколько отличается от сферической.
291
На рис. 4.10.2.2 изображены мгновенные положения дочернего ядра и α - частицы. Заменим распределенный электрический заряд дочернего ядра воображаемым эффективным электрическим зарядом. Теперь положение эффективного заряда в общем случае не совпадает с центром симметрии ядра, мгновенное положение эффективного заряда будет смещено на величину ∆R . Так как α -распад происходит только в ядрах с большим числом нуклонов, причем число протонов в ядре всегда намного меньше числа нейтронов, то можно считать, что форма дочернего ядра практически не изменится, она останется сферически симметричной. В дальнейшем положение α -частицы будем отсчитывать от центра симметрии ядра. q* = Ze
R qα = 2e
q*
0
∆R
A
r
RЯ 2 Rα RЯ + Rα
Рис. 4.10.2.2. Схема расположения дочернего ядра и α - частицы Пусть точка A – точка касания α - частицы с воображаемой поверхностью дочернего ядра. В точке A потенциалы электрических полей дочернего ядра и α - частица равны между собой: q q* ϕ А ( RЯ ) = ϕ А ( Rα ) или = α . R я + ∆Rmax Rα Отсюда 1 + ∆Rmax R я (4.10.2.1) q* = qα Rя , Rα где Rя – эффективный радиус дочернего ядра, Rα – эффективный радиус α - частицы. Дальнейшие рассуждения проведем применительно к радиоактивному распаду радия
292 α 226 138 222 136 4 ⎯ ⎯→ + 2 He 2 88 Ra 86 Rn 1, 6 ⋅10 3 лет
.
Оценки показывают, что эффективные радиусы ядер радона и α −15 м, Rα ≈ 0,8 ⋅ 10 −15 м, т.е. Rα Rя ≈ 0,1 . частицы равны Rя ( 222 86 Rn) ≈ 8 ⋅ 10 Кроме того, q* qα = Z 2 . Найденные значения поставим в (4.10.2.1): Z 0,1 = 1 + ∆ymax , 2 где ∆Rmax ∆ymax = , Rя откуда для радона получаем: 0,1 ⋅ 86 ∆ymax = − 1 = 3,3 . 2 Предположим, что относительное смещение ∆y эффективного заряда, возникающего под действием электрического поля α - частицы, равно 2
∆y = ∆ymax e1− y .
(4.10.2.2) Сила, действующая на α - частицу со стороны дочернего ядра (рис. 4.10.2.2), q*qα Fα = . (4.10.2.3) 4πε0 ( R + ∆R ) 2 Подставим в (4.10.2.3) значения из формул (4.10.2.1) и (4.10.2.2). Тогда 4e 2 1 + ∆y . Fα = 2 2 0,1 4πε0 RЯ ( y + ∆y )
Величину потенциальной энергии взаимодействия между α частицей и дочерним ядром можно вычислить после интегрирования: y
U = −U 0
1 + 3,3 e1− y
∫ (y + 3,3 e 1
2
1− y 2
)
2
dy ,
(4.10.2.4)
где U0 =
e2 , U 0 = 7,19 МэВ , RЯ = 8 ⋅10 −15 м . 0,1 πε0 RЯ
293
На рис. 4.10.2.1 приведен график потенциальной энергии, построенный по формуле (4.10.2.4). На рис. 4.10.2.1 y = 1 – граница дочернего ядра, y1 = R1 RЯ – относительная координата точки туннельного вылета α - частицы за пределы ядра. Оценим вероятность вылета α частицы за пределы материнского ядра. В разделе 1.7.5 рассматривалось прохождение электронов туннельным эффектом через потенциальный барьер прямоугольной формы. Такая форма потенциального барьера была выбрана не случайно и преследовала две цели: одна – показать в общих чертах, как решаются в квантовой механике подобные задачи; другая – какие физические выводы вытекают из полученного решения. Точно такой же подход к решению подобной задачи можно применить не только для электронов, но и для микрочастиц иной физической природы, в частности и для α - частиц, двигающихся в сторону потенциального барьера конечной толщины. Тогда аналогичное выражение для коэффициента прозрачности потенциального барьера будет справедливо и для α частиц. Напомним его: ⎛a ⎞ 4⎜⎜ 3 ⎟⎟ ⎝ a1 ⎠
D= ⎛a ⎞ 4⎜⎜ 3 ⎟⎟ ⎝ a1 ⎠
2
2
2
⎛ ⎛ a ⎞2 ⎞ + ⎜ ⎜⎜ 3 ⎟⎟ − 1⎟ sh 2 (a3l ) ⎜ a1 ⎟ ⎝⎝ ⎠ ⎠
,
(4.10.2.5)
где l – толщина потенциального барьера; a12
2m 2m = 2α ε , a32 = 2α (U − ε) ; η η
2
⎛ a3 ⎞ U − ε ⎜⎜ ⎟⎟ = ; ε ⎝ a1 ⎠ 2
⎛ e a 3l − e − a 3l ⎞ ⎟ . sh (a3l ) = (sh (a3l ) ) = ⎜ ⎜ ⎟ 2 ⎝ ⎠ a3l − a3l Если выполняется условие e >> e , то 1⎞ ⎛ 2l 1 sh 2 (a3l ) = exp⎜⎜ (2mα (U − ε) )2 ⎟⎟ . 4 ⎝η ⎠ Подставим найденные значения в (4.10.2.5). После некоторых преобразований получаем: 2
2
294 1 ⎞ ⎛ 2l ⎛ ⎞ D = D0 exp⎜ ⎜ 2mα (U − ε) 2 ⎟ ⎟ , ⎟⎟ ⎜ ⎜η ⎠⎠ ⎝ ⎝
(4.10.2.6)
где D0 =
16 ⎛ ⎛ ε ⎞2 ⎞ 4 + ⎜1 − ⎜ ⎟ ⎟ ⎜ ⎝U − ε ⎠ ⎟ ⎝ ⎠
2
.
(4.10.2.7)
Величина коэффициента прозрачности сильно зависит от высоты потенциального барьера. Оценим его величину на примере α - распада радия. Высоту потенциального барьера вычислим по формуле: 2Ze 2 U max = . (4.10.2.8) 4πε0 ( RЯ + Rα ) Так как у
222 86 Rn
Z = 86 ,
RЯ = 8 ⋅ 10−15 м, радиус α -частицы
Rα = 0,8 ⋅ 10 −15 м, то после вычислений по формуле (4.10.2.8) получаем U max =
2 ⋅ 86 ⋅ 1,6 ⋅ 10 −19 ⋅ 10 −6
= 28,3 МэВ . 4π ⋅ 8,85 ⋅ 10 −12 ⋅ 8,8 ⋅ 10 −15 По формуле (4.10.2.6) можно вычислить коэффициент прозрачности потенциального барьера, однако по физическому смыслу он отличается от вероятности вылета α - частицы за пределы ядра. Для определения вероятности вылета из ядра за 1 с (постоянная распада) необходимо умножить коэффициент прозрачности на число столкновений α - частицы с потенциальным барьером за 1 с. Поэтому v λ= α D, (4.10.2.9) 2 RЯ где vα – средняя скорость α - частицы в материнском ядре. Для оценки величины vα воспользуемся соотношением неопределенности: mα ∆υα ⋅ ∆r = η Полагаем, что скорость α - частицы vα равна неопределенности скорости в потенциальном барьере ∆vα , а неопределенность ее координаты ∆r равна толщине стенки потенциального барьера l на уровне полной η энергии, vα = Тогда число столкновений с барьером за 1 с mα λ
295
vα η = 2 RЯ mα ⋅ l ⋅ 2 RЯ и после подстановки значений в (4.10.2.9) получаем 1 η ⎛ 2l ⎞ D0 exp⎜ − (2mα (U − ε) )2 ⎟ . (4.10.2.10) λ= mα ⋅ l ⋅ 2 RЯ ⎝ η ⎠ Из (4.10.2.10) видно, что постоянная распада очень сильно зависит от толщины потенциального барьера: чем толще потенциальный барьер l , тем меньше вероятность α - частице преодолеть его туннельным эффектом, тем меньше постоянная распада λ и тем больше будет период полураспада T1 . Следовательно, быстрым α - частицам должен ν=
2
соответствовать меньший период полураспада, медленным – больший, что полностью соответствует экспериментальным наблюдениям. 238 Известно, что у 226 88 Ra , возникающего в радиоактивном ряду 92 U , период полураспада T1 = 1,6 ⋅ 103 лет = 5,04 ⋅ 1010 с. Подстановка соот2
ветствующих значений в (4.10.2.8) и (4.10.2.10) позволяет определить толщину стенки потенциального барьера на уровне полной энергии ε = 4,2 МэВ. Вычисления по формуле (4.10.2.10) дали следующий результат: l = 9,072 ⋅ 10 −15 м, что представляется вполне правдоподобным. К настоящему времени установлено из опыта несколько законов α - распада. 1. α - излучение для каждого изотопа практически однородно. Характерной константой α - излучения является пробег α - частицы в веществе. Между пробегом α - частицы в воздухе и ее начальной скоростью существует зависимость, выражаемая формулой Гейгера
v03 = aR0 ,
(4.10.2.11)
м2 м , [v0 ] = , [ R0 ] = м . с с 2. Зависимость между величиной пробега частицы и постоянной распада четно-четных ядер описывается формулой Гейгера-Нэттола lg λ = b1 + b2 lg R0 , (4.10.2.12) где b1 и b2 – коэффициенты, каждый из которых имеет свои значения в различных радиоактивных семействах. 3. Пробег R α - частиц в любом веществе приближенно можно определить при помощи уравнения Брэгга - Климена: где a = 1,08 ⋅ 1023
296 1
R0 2 A , (4.10.2.13) ρ [ R ] = [R 0 ] = м ; ρ – плотность вещества, кг/м, A – массовое число. R = 0,3
4.10.3. β- распад Под общим названием β - распад в настоящее время понимаются
три самостоятельные процесса: β + , β − , e − – захват. Между ними имеется много общего. β - распад сопровождается γ -излучением, поскольку при β - распаде дочернее ядро находится в возбужденном состоянии. В настоящее время установлено, что примерно 46% существующих в природе искусственных и естественных нуклидов испытывают β − - распад. β + - распад связан с испусканием позитрона, он возникает только у ядер, полученных в лабораторных установках, в естественных условиях не наблюдается. Около 11% всех известных изотопов распадаются с испусканием позитрона. β + - распад имеет место главным образом у легких ядер. e − - захват наблюдается лишь у тяжелых ядер, это вызвано тем, что некоторые тяжелые ядра могут захватывать ближайшие электроны из электронной оболочки своего атома. При этом заряд ядра уменьшается на единицу. Если захват электрона происходит с ближайшей к ядру K -оболочки, т.е. захватывается электрон 1s , то такой процесс называется K -захватом, если же захват электрона происходит с L -оболочки, т. е. захватывается один из электронов слоя 2s 2 p , то такой процесс называется L -захватом. Обычно вероятность L -захвата во много раз меньше вероятности K захвата. На K -захват приходится примерно 25% всех радиоактивных распадов в природе. Важнейшие особенности β -распада. 1. β − - распад характерен для пересыщенных нейтронами ядер, когда один из нейтронов ядра переходит в протонное состояние и при этом испускает электрон и антинейтрино. Например, 0 3 3 0 0~ 1 H → 2 H + −1 e + 0 ve ; T1 = 12 лет. Энергия вылетающего электрона −1 e и 2
антинейтрино v~e : ε( −10 e + v~e ) = 18 кэВ.
297 +
2. β - распад характерен для пересыщенных протонами ядер, когда один из протонов ядра переходит в нейтронное состояние и при этом испускает позитрон и нейтрино. Например, 116C →115B + +10e + ve ; T1 = 20,4 мин. Энергия вылетающего позитрона
0 +1 e
равна 970 кэВ.
2
3. При K -захвате существует заметная вероятность ядру захватить ближайший к нему K -электрон, при этом один из протонов ядра переходит в нейтронное состояние, а из ядра вылетает нейтрино. Например, 47 Be+ −10e→37 Li + ve ; T1 = 53,6 дня. 2
4. Энергетический спектр электронов и позитронов непрерывен (рис. 4.10.3.1). Непрерывность спектра, на первый взгляд, кажется удивительной, так как энергия любой частицы в ядре, также как и в атоме, должна быть квантована, сами частицы должны находиться на определенном уровне энергии. dN dK
β − ,β
0
ε max
+
ε max
K
Рис. 4.10.3.1. Энергетический спектр электронов и позитронов Объяснение физической причины непрерывности спектра было дано В. Паули. Он предположил, что в данном процессе наряду с электроном одновременно из ядра вылетает какая-то новая частица, которая на опыте не обнаруживается. Эту частицу Э. Ферми назвал нейтрино (маленький нейтрон). В настоящее время считается, что при β − распаде вместе с электроном из ядра вылетает антинейтрино v~e , а при
298
β + - распаде вместе с позитроном из ядра вылетает нейтрино ve . Дальнейшими исследованиями было установлено, что нейтрино – это частицы, у которых Z = 0 , A = 0 , масса покоя mv ≤ 2,5 эВ, барионный заряд B = 0 , спиновое квантовое число sv = 1 2 . Из таблицы элементарных частиц следует, что нейтрино ve , электрон −1 e , мюон µ обладают одной важнейшей характеристикой, а именно, лептонным зарядом λ . У всех этих частиц λ = 1 , а у остальных частиц, в том числе и у фотонов, лептонный заряд отсутствует. У антилептонов λ = −1 . В природе, наряду с другими законами сохранения, выполняется закон сохранения лептонного заряда. Поэтому в ядерных реакциях общий лептонный заряд всегда сохраняется неизменным. Нейтрино – очень распространенные в природе частицы. Так, на массу потока нейтрино приходится примерно 25% от общей массы излучаемой солнцем материи. То же самое можно сказать и о звездах. Важнейшей особенностью нейтрино является очень слабое взаимодействие с другими частицами материи. Насколько слабо это взаимодействие, свидетельствует тот факт, что обычно нейтрино пролетает через всю Землю, так и не провзаимодействовав с частицами вещества земли. Для нейтринных потоков Земля является практически прозрачной средой. Для обнаружения нейтрино применяют специальные установки, спектрометры нейтрино, представляющие собой цистерны, заполненные C2Cl4 . Один из таких спектрометров создан в США (Брукхейвен, 1968 г), он расположен на глубине 1480 м в бывшей соляной шахте. Там находится цистерна, содержащая 610 т C2Cl4 . Регистрация нейтрино основана на счете числа радиоактивных атомов 37 18 Ar , образующихся в ядерной реакции: 37 17 Cl
37 37 37 + ve →18 Ar + −10e ; 18 Ar →17 Cl + +10e + ve ; −10 e+ +10e → 2 γ . В спектрометре регистрируются 2γ кванта, разлетающиеся по закону сохранения импульса в противоположные стороны. Заметим, 37 17 Cl – стабильный изотоп, в природе его 24,6%. Наряду с ним суще35 ствует стабильный изотоп 17 Cl , в природе его 75, 4%. Нейтрино рождаются при высоких температурах в недрах солнца и звезд в результате протекающих там ядерных реакций. Поэтому изучение углового распределения потоков нейтрино позволяет как бы заглянуть в глубь солнца и даже некоторых звезд.
299 −
Исходя из сказанного, β - распад можно записать в виде ядерной реакции β− A A 0 ~ Z X ⎯⎯→ Z +1Y + −1 e + ve + Q1 . Этот процесс при β − - распаде происходит потому, что в ядре один из нуклонов переходит из нейтронного в протонное состояние: n⎯ ⎯→ p + −10e + v~e . Становится понятной физическая причина возникновения антинейтрино. При β − - распаде один из нуклонов перешел из нейтронного состояния в протонное, этот процесс сопровождается испусканием электрона, что необходимо для выполнения закона сохранения электрического заряда. Но рождение электрона означает, что возникла частица, у которой лептонный заряд λ = +1 . И для того, чтобы не нарушился закон сохранения лептонного заряда, необходимо появление античастицы, у которой лептонный заряд λ = −1 . Такой частицей является антинейтрино. β + - распад происходит по следующей схеме: +
β A 0 ⎯⎯→ Z −1Y + +1 e + ve + Q2 , при этом в ядре происходит превращение одного из протонов в нейтрон: p⎯ ⎯→ n + +10e + ve . Здесь для выполнения законов сохранения электрического и лептонного зарядов необходимо появление позитрона и нейтрино. При e − -захвате имеет место поглощение ядром ближайшего к нему атомного электрона из K - или L - слоя: A 0 ⎯→ Z −A1Y + + ve + Q3 , Z X + −1 e ⎯ при этом в ядре протон поглощает электрон, и возникают нейтрон и нейтрино: p + −10e ⎯ ⎯→ n + ve . A Z X
4.11. Ядерные реакции
Ядерными реакциями называются процессы превращения атомных ядер, происходящие в результате их взаимодействия с элементарными частицами или с другими ядрами. Обычно ядерная реакция вызывается бомбардировкой ядер некоторого вещества потоком ускоренных частиц: протонов, нейтронов, α - частиц и др.
300
В результате интенсивного взаимодействия исходного ядра ZA X и сталкивающейся частицы a образуется новое ядро – ядро-продукт A1 Z 1Y и некоторая частица b , разлетающиеся в разных направлениях от места столкновения. Ядерные реакции символически записываются следующим образом: ⎧ ZA X + a или ZAX (a, a ) ZAX − упругое рассеяние, ⎪ ⎪ ZA X * + a или ZAX (a, a) ZAX * − неупругое рассеяние, ⎪ A A1 Z X + a → ⎨ A1 A ⎪ Z1Y + b или Z X (a, b) Z1Y , ⎪ A1 A1 A ⎪⎩ Z1Y + γ или Z X (a, γ ) Z1Y − радиационный захват. При большой энергии частицы a вместо одной частицы b могут возникнуть несколько новых частиц b1 , b2 , ... . Ядерные реакции могут протекать как с выделением, так и с поглощением энергии. В качестве примера приведем две реакции: 14 17 14 4 17 1 7 N + 2 He→ 8 O +1p , сокращенное обозначение 7 N (α, p) 8 O = N (α, p)O ; 9 4 12 1 4 Be+ 2 He→ 6 C + 0 n
, сокращенное обозначение 49Be(α, n)126C = Be(α, n)C .
Ядерные реакции типа
A1 A Z X ( a, b) Z1Y
сопровождаются перестройкой
атомных ядер. Однако при этом всегда выполняются следующие законы сохранения: электрического, барионного зарядов, полной энергии, импульса, момента импульса и некоторых других характеристик атомного ядра. Исследование ядерных реакций позволило установить экспериментальные закономерности, на основании которых было дано теоретическое объяснение процессов ядерных превращений. Одна из этих теорий, теория составного ядра, впервые была предложена Н. Бором в 1936 г. Она удовлетворительно объясняет ядерные превращения при энергии бомбардирующих частиц до 50 МэВ. A Ядерная реакция ZA X ( a , b) Z11Y по этой теории протекает в два этапа. На первом этапе ядро образуется составное ядро
A Z X Ac * Z cY
захватывает частицу a . В результате в возбужденном состоянии:
A Z X
+ a → ZAcc Y * .
301
Энергия возбуждения ε воз составного ядра складывается из энергии связи ε св частицы a в составе ядра и части кинетической энергии частицы, преобразующуюся затем в энергию покоя ядра Aa ε воз = ε св + Ka , A + Aa где A – массовое число ядра, Aa – массовое число налетающей частицы, K a – кинетическая энергия налетающей частицы. A Если A >> Aa , то ε воз ≈ ε св + a K a . A В результате сильных взаимодействий между нуклонами ядра и непрерывных столкновений нуклонов между собой энергия возбуждения, которая привносится в ядро налетающей частицей a , быстро перераспределяется между остальными нуклонами. Благодаря флуктуациям в определенный момент времени значительная часть энергии возбуждения оказывается сосредоточена на одном из нуклонов вблизи поверхности ядра. Допустим, что этой энергии вполне хватает для вылета частицы b за пределы составного ядра. Тогда наступает второй этап реакции – распад составного ядра на ядро ZA11Y и частицу b : Ac * A1 Z c Y → Z1 Y
+b.
Из опыта следует, что время жизни составного ядра τ ≥ 10 −14 c . На рис. 4.11.1 условно изображено невозбужденное ядро урана 238 92 U . С ним сталкивается налетающая частица a . В диаметре ядра укладывается примерно 26 нуклонов. Значит, возбуждение передается от одного края ядра к другому путем последовательных столкновений в цепочке из 26-ти нуклонов. Время передачи возбуждения τ0 = 2 RЯ с ; τ0 = 6 ⋅ 10 −15 3 ⋅ 108 = 2 ⋅ 1023 с ,
RЯ – радиус ядра, с = 3 ⋅ 108 м/с. Следовательно, отношение τ τ0 =1 ⋅ 10−14 2 ⋅ 10−23 = 5 ⋅ 108 . Таким образом, относительное время жизни τ τ0 составного ядра настолько велико, что составное ядро как бы успевает "забыть" о причине своего возбуждения, и спустя время τ = 10 −14 с составное ядро распадается по законам радиоактивного распада с учетом вероятности протекания того или иного распада.
302
2 RЯ ≈ 6 ⋅10 −15 м
ρ
υa a
2 RЯ
Рис. 4.11.1. Схема соударения α - частицы с ядром В качестве примера приведем различные ядерные реакции, приводящие к возникновению одного и того же составного ядра, а также к появлению различных каналов распада составного ядра; разумеется, вероятности реализации различных каналов распада здесь разные, способ распада составного ядра определяется величиной энергии возбуждения. 23 11
25 12
Na + α
Mg + d
27 13
Al + γ
27 13
Al *
23 11
Na + α
25 12
Mg + d
27 13
Al + γ
Примечание. В приведенной схеме ядерных реакций использованы следующие обозначения: α = 24He , α - частица (ядро атома гелия); d = 12H , дейтрон (ядро тяжелого изотопа водорода); γ = hν (гаммаквант).
303
4.12. Эффективное сечение ядерной реакции
Для оценки вероятности протекания ядерной реакции широко пользуются понятием эффективное сечение реакции или эффективное сечение взаимодействия частиц A и a . Для определения вероятности взаимодействия частицы с ядром рассмотрим плоскую мишень, изготовленную из однородного вещества (см. рис. 4.12.1). В случае толстой мишени число частиц a , прошедших через слой x , меняется с глубиной. Поэтому для оценки числа частиц, прошедших через определенный слой вещества, должно быть составлено дифференциальное уравнение для некоторого слоя толщиной dx , расположенного на глубине x . l N0
N (x)
N (l )
a
a a
a
a
x
dx
Рис. 4.12.1. Взаимодействие частиц с ядрами мишени Тогда число частиц dN , вступивших в ядерную реакцию за время t , т.е. число частиц, выбывших из первичного пучка за время t после прохождения потока через слой толщиной dx , dN = −σN ( x)ndx , (4.12.1) где σ характеризует вероятность того, что ядро A в результате попадания в него частицы а превратится в ядро B с испусканием частицы b , σ – эффективное сечение реакции; N ( x) – число частиц a , дошедших до слоя dx на глубине x за время t ; n - концентрация ядер A в мишени. После интегрирования (4.12.1) получаем N ( x) = N 0 exp(−nσ x) , (4.11.2) N 0 – число частиц а, падающих на наружную поверхность мишени A . Тогда через мишень толщиной l пройдет число частиц N (l ) :
304
N (l ) = N 0 exp(−nσ l ) . (4.12.3) По определению, вероятность протекания ядерной реакции на глубине x в слое толщиной dx пропорциональна как концентрации ядер, так и толщине слоя dx , причем коэффициентом пропорциональности служит эффективное сечение взаимодействия σ : dw = σ ndx . Отсюда 1 dw σ= . (4.12.4) n dx Из формулы (4.12.4) следует, что размерность эффективного сечения м 2 . Из (4.12.3) после логарифмирования получаем выражение для эффективного сечения ядерной реакции: 1 N σ = ln 0 . (4.12.5) nl N (l ) Как следует из (4.12.5), для определения эффективного сечения взаимодействия потока частиц а с ядрами мишени A достаточно в специальных опытах измерить ослабление потока частиц а в слое мишени толщиной l . Эффективное сечение измеряется в м 2 , либо в барнах: 1 барн = 1 ⋅10−28 м 2 . 4.13. Деление тяжелых ядер при захвате нейтрона
В 1919 г. Э. Резерфорд открыл реакцию превращения одного ядра в другое: 14 17 7 N + α→ 8 O + p , или в сокращенной форме записи 14 17 7 N (α, p ) 8 O . Во все последующие годы вплоть до 1938 г. физики наблюдали ядерные реакции типа A1 A Z X ( a , b ) Z1Y . Но в 1938–39 гг. при облучении тяжелых ядер потоком нейтронов была обнаружена реакция нового типа; оказалось, что наряду с обычA ной ядерной реакцией ZA X ( a , b) Z11Y , где a – нейтрон, возникает реакция деления ядра на осколки:
305 A Z X
( n,3n)( ZA11Y + ZA22 Y ) .
Таким образом, было установлено, что в составном ядре, возникшем после поглощения материнским ядром нейтрона, в ядре происходит столь сильная перестройка состояний нуклонов, что оно делится на две неравные по величине части с испусканием двух или трех нейтронов. Может возникнуть вопрос: почему такое деление ядер не наблюдалось ранее? Ответ может быть таким. Реакции с нейтронами могли быть проведены лишь после открытия нейтронов. Но нейтроны были открыты лишь в 1932 г., и потребовались годы исследований, пока не выяснили все особенности ядерных реакций с участием нейтронов. Почему же из всех видов столкновений частиц с тяжелыми ядрами столкновения с нейтронами приводят к качественно новым результатам по сравнению со столкновениями других элементарных частиц? Все дело в том, что нейтрон – электрически нейтральная частица. Поэтому при движении в сторону тяжелого ядра нейтрон без изменения своей кинетической энергии, без изменения направления движения может вплотную подойти к ядру и проникнуть внутрь его. Для нейтрона нет силы, препятствующей его движению в сторону ядра. Протону и другим положительно заряженным частицам для проникновения в ядро необходимо предварительно затратить энергию, необходимую для преодоления силы электростатического отталкивания, которые оказываются особенно большими вблизи ядра. Кроме того, наличие силы отталкивания приводит к тому, что в процессе движения протон, α -частица, как правило, отклоняются в сторону от ядра. Все это приводит к тому, что вероятность столкновения заряженных частиц с ядром оказывается гораздо меньше вероятности столкновения нейтральной частицы с ядром. Наконец, положительно заряженная частица, сталкиваясь с ядром, постепенно теряет свою кинетическую энергию. Стало быть, не всякая заряженная частица может проникнуть в ядро, а лишь та, у которой кинетическая энергия больше потенциальной энергии сил отталкивания. Что же касается электронов, то они могут проникать в ядро, об этом свидетельствует наличие в природе явления e − -захвата. Но если кинетическая энергия электронов меньше 1 МэВ, то проникновение электрона в ядро не вызовет деления ядра на осколки. Что же касается других отрицательно заряжен-
306
ных частиц, например, различных видов гиперонов, то потоки их большой плотности в настоящее время получить очень трудно. Как уже отмечалось ранее, теоретически вопросы деления тяжелых ядер впервые рассматривались Бором, Уилером и независимо от них Френкелем в 1939 г. В основу своих рассуждений они положили модель жидкой капли. В результате проведенного анализа они пришли к выводу, что способность ядер к делению определяется соотношением сил электростатического расталкивания протонов ядра и ядерных сил притяжения. Процесс деления можно представить следующим образом. На материнское ядро падает нейтрон, проникает в него. В результате возникает составное ядро, находящееся в возбужденном состоянии. Энергия возбужденного ядра после проникновения в него нейтрона, как это следует из графика εсв A = f ( A) , порядка 6 МэВ. Эта энергия столь значительна, что возникает сильное возбуждение ядра. Процесс символически можно записать следующим образом: A 1 A +1 * Z X + 0 n→ Z X , где A +Z1 X * – возбужденное составное ядро. Энергия возбуждения составного ядра складывается из двух составляющих: энергии связи нейтрона в составном ядре и кинетической энергии налетающего нейтрона A ε ε воз = св + Kn , A A +1 K n – кинетическая энергия налетающего нейтрона. Опыт показывает, что энергия возбуждения составного ядра у различных тяжелых ядер находится в интервале 5,8 МэВ ≤ ε воз ≤ 6,9 МэВ . В результате возбуждения ядро приходит в колебательное движения, вытягиваясь то в одну, то в другую стороны, ядро испытывает непрерывную деформацию своего объема (рис. 4.13.1). Если энергия возбуждения ε воз превышает некоторую минимальную энергию, энергию активации ε а , то деформация составного ядра достигает такой величины, при которой у ядра возникает перетяжка, и силы расталкивания между положительными электрическими зарядами различных частей составного ядра становятся больше ядерных сил притяжения. В результате ядро делится на два осколка. Следовательно, если бы ядро было бы электрически нейтрально, то наличие пере-
307
тяжки не привело бы к делению ядра на две части: деление ядра возникает потому, что между протонами ядра существуют силы электрического расталкивания. Таким образом, нейтроны ответственны за возбуждение, а протоны – за деление ядра.
1 0
n
ρ
υn
A Z
t0
A+1 * Z
A+1 * Z
X
X
<
t1
X
<
t2
Рис. 4.13.1. Деформация ядра У возникших осколков отношение числа нейтронов к числу протонов больше, чем такое же отношение у стабильных ядер: N/Z > ( N/Z ) стаб . При делении тяжелого составного ядра A +Z1 X * в каждом акте деления выбрасывается в среднем два или три нейтрона. А так как составное ядро находится в сильно возбужденном состоянии, то часть энергии возбуждения, кроме того, высвечивается в виде γ -квантов. Наряду с этим, возбужденное ядро −
A +1 * Z X
также может испустить избыточ-
ный нейтрон или испытать β - распад. Вследствие больших сил электростатического расталкивания между осколками β-осколки разлетаются в разные стороны с большими скоростями, доходящими до 1/30 скорости света. При столкновении этих осколков с другими ядрами препарата происходит преобразование кинетической энергии осколков в внутреннюю энергию других частиц с выделением большого количества тепла. Осколки, образовавшиеся в момент деления, пересыщены нейтронами. При этом форма осколков сильно отличается от сферической. Из математики известно, что площадь поверхности сферы при неизменном объеме минимальна по сравнению с другими поверхностями. Поэтому в процессе образования сферической поверхности, соответствующей невозбужденному состоянию ядра, осколки выделяют из-
308
быточную энергию в виде γ -квантов или β − -излучения. Если же возбуждение ε воз , привнесенное в ядро, меньше энергии активации ε а , то возникающая деформация ядра не достигнет критического значения, ядро не испытает деления на осколки, избыточная энергия будет растрачена в результате столкновения с другими ядрами, а также в результате α , β − -распадов. Следовательно, деление ядра может быть вызвано лишь такими нейтронами, у которых ε A K n + св ≥ ε а , ≈ 1. (4.13.1) А A +1 Такие простые представления, основанные на капельной модели ядра, позволяют понять, почему одни ядра делятся под действием как тепловых, так и быстрых нейтронов, а другие делятся только под действием быстрых нейтронов, у которых K n > 1 МэВ. На рис. 4.13.2 изображена последовательность изменения состояний составного ядра во времени до момента его распада после попадания в материнское ядро нейтрона. A Z
1 0
n
ρ
υn
A+1 * Z
A+1 * Z
X
X
X
A1 Z1
Y*
A2 Z2 1 0
n
ρ
+q
+ q1
+ q2
+ q1
+ q2
υ1
ρ
+ q1
+ q2 1 0
t0
Y*
<
t1
<
t2
<
υ2
n
t3
Рис. 4.13.2. Распад составного ядра Из рис. 4.13.2 видно, что в момент разрыва из области перетяжки вылетают два или три мгновенных нейтрона, а сами осколки разлетаются в противоположные стороны, причем направления движения осколков и мгновенных нейтронов определяются законами сохранения энергии и импульса. Как следует из выражения (4.13.1), при выполнении неравенства ε св > ε а составное ядро будет делиться при любой величине кинетиА ческой энергии падающего на ядро нейтрона, в том числе и при теп-
309
ловой. Минимальная кинетическая энергия, которой может обладать нейтрон в препарате, не может быть меньше средней кинетической энергии хаотического движения частиц. Поэтому нейтроны, обладающие такой кинетической энергией, называются тепловыми нейтронами. Тепловые нейтроны – это нейтроны, которые находятся в состоянии динамического равновесия с другими частицами радиоактивного препарата, с другими частицами облучаемого нейтронами вещества. ε Если же в уравнении (4.13.1) св < ε а , то энергия возбуждения соА ставного ядра, возникающая в результате дефекта массы нейтрона в ядре, оказывается недостаточной для возникновения в ядре перетяжки. Стало быть, такой энергии оказывается недостаточно для деления ядер на два осколка. Для возникновения реакции деления тяжелого ядра должно выполняться неравенство (4.13.1) или, что то же самое, ε (4.13.2) K n ≥ ε а − св . А В табл. 4.13.1 приводятся некоторые характеристики ядер, а также типы нейтронов, вызывающих деление тяжелых ядер. % содержание в природе
Обозначение нуклида
ε воз МэВ
εа МэВ
Kn
min
Вид нейтрона
p
-
233 92
5,9
5,5
0,025 эВ
Тепловой
0,91
0,006
234 92
5,8
6,2
0,4 МэВ
Быстрый
0
0,712
235 92
6,8
6,6
0,025 эВ
Тепловой
0,83
99,282
238 92
U
5,7
7,1
1,4 МэВ
Быстрый
0
Pu
6,9
5,1
0,025 эВ
Тепловой
0,65
-
U U
U
239 94
Табл. 4.13.1. Ядра и типы нейтронов
310
В табл. 4.13.1 приняты следующие обозначения: ε воз – энергия возбуждения составного ядра после поглощения теплового нейтрона; ε а – энергия активации; K n – минимальная кинетическая энергия, min
которой должен обладать нейтрон для соответствующего деления ядра; p – вероятность распада ядра под действием тепловых нейтронов. Из табл. 4.13.1 следует, что энергия активации оказывается разной у различных ядер. Это связано с тем, что в разных ядрах энергия связи нейтронов в ядре оказывается не одинакова. Составное ядро A +Z1 X * , возникшее после поглощения материнским ядром одного нейтрона, может не только делиться, но и излучать γ - кванты, нейтроны, быстрые электроны. Опыт показывает, что вероятности деления тяжелых ядер нейтронами весьма сильно различаются у различных ядер. В табл. 4.13.2 приводятся эффективные сечения σ ядерных реакций под действием тепловых нейтронов, в барнах. Тип ядерной реакции A Z
A Z
X (n,3n)( ZA11Y + ZA22 Y )
X (n, n) ZAX *
(неупругое рассеяние) A Z
Природный уран
532
549
0
664
3,9
0
8,2
8,2
0
8,2
52
101
2,8
360
3,5
U
X (n, γ ) A +Z1X
( радиационн ый захват )
Pu
235 92
U
238 92
239 94
233 92
U
Таблица 4.13.2. Эффективные сечения σ ядерных реакций под действием тепловых нейтронов Из анализа табл. 4.13.2 следует, что для реакции деления как будто 239 бы выгоднее всего использовать ядра 235 92 U или 94 Pu . Однако это далеко не так. Так,
239 94 Pu
в естественных минералах практически не со-
держится. Что же касается изотопа
235 92 U
, то он в природе встречается
311 233 92 U
238 92 U
235 92 U
редко, а изотоп – еще реже. Разделение и на отдельные фракции – это очень сложный процесс, он основан на использовании метода газовой диффузии. Промежуточными продуктами этого метода являются крайне агрессивные вещества, которые вступают в химические соединения практически со всеми другими веществами. Из табл. 4.13.2 также видно, что 238 92 U под действием тепловых нейтронов практически не делится, деление происходит только под действием быстрых нейтронов. Но тогда процесс будет протекать столь быстро, что может произойти ядерный взрыв, и необходимо применять специальные методы для замедления ядерной реакции. Итак, мы рассмотрели физическую причину деления тяжелых ядер под действием нейтронов. Может возникнуть вопрос: а почему под действием нейтронов на осколки делятся только тяжелые ядра? Причина здесь следующая. В тяжелых ядрах присутствует значительное число положительно заряженных частиц, протонов. Поэтому в них существуют значительные силы кулоновского расталкивания. Избыток энергии ядерных сил притяжения над потенциальной энергией сил отталкивания определяется как раз величиной той энергии, которую привносит в тяжелое ядро дополнительный нейтрон. В легких ядрах энергия, связанная с попаданием нейтрона в ядро, оказывается недостаточной для того, чтобы вызвать деление ядра. У легких ядер отношение кулоновских к ядерным силам гораздо меньше подобного отношения у тяжелых ядер, и поэтому относительное значение энергии активации у легких ядер во много раз больше относительной энергии активации у тяжелых ядер. В настоящее время, несмотря на всю сложность процесса сепарации при получении изотопа 235 92 U , в ядерной энергетике эти изотопы находят самое широкое применение из-за того, что деление ядер этих изотопов происходит под действием тепловых нейтронов, стало быть, и меньшие требования предъявляются к экологической безопасности. 4.14. Продукты деления урана под действием тепловых нейтронов
Ядро изотопа урана 235 92 U под действием теплового нейтрона чаще всего делится на два осколка. Но массовые числа осколков оказываются разными в интервале значений 72 < A < 161 . Для характеристики распределения возникающих осколков по массовым числам
312
вводится понятие выхода осколков на одно деление. Выход осколков на деление равен отношению числа делений с образованием данного осколка деления к общему числу делений. График выхода осколков на одно деление 235 92 U как функция массового числа A приведен на рис. 4.14.1. ω ,% 10
1 0,1
0,01 0,001
95
115
140
Рис. 4.14.1. Выход осколков на одно деление
A 235 92 U
На графике выхода имеется группа легких осколков деления, состоящая из ядер с массовыми числами от 80 до 110 и имеется группа тяжелых осколков деления, состоящая из ядер с массовыми числами от 125 до 155. Деление ядра на два осколка с массовыми числами от 110 до 125 происходит крайне редко. Следовательно, при делении ядра наиболее вероятно образование легкого и тяжелого осколков. Важнейшей особенностью продуктов деления составного ядра является его радиоактивность. Это связано с тем, что в образовавшихся осколках имеет место избыток нейтронов по сравнению с числом нейтронов в стабильных изотопах. Так, двум максимумам на графике рис. 4.14.1 соответствуют массовые числа 94 и 140, что соответствует ра94 диоактивным изотопам 38 Sr и 140 54 Xe . Массовые числа стабильных ядер стронция и ксенона равны 88 и 136. Поэтому радиоактивное ядро 94 Sr имеет в избытке шесть нейтронов, а радиоактивное ядстронция 38 ро ксенона
140 54 Xe –
четыре нейтрона.
313
Осколки деления дают начало радиоактивным цепочкам β − распадов, которые всегда заканчиваются стабильным ядром. В качестве примера приведем одну из возможных цепочек: β− 94 94 38 Sr ⎯⎯→ 39Y
−
−
−
β β β 94 94 94 ⎯⎯→ 40 Zr ⎯⎯→ 41 Nb ⎯⎯→ 42 Mo . Осколки деления и продукты их радиоактивного распада называют продуктами деления. При каждом делении ядра возникает несколько нейтронов деления. Нейтроны деления подразделяются на мгновенные и запаздывающие. Мгновенные нейтроны испускаются в момент деления, запаздывающие – спустя некоторое время после момента деления ядра, они испускаются осколками. Мгновенные нейтроны вылетают из шейки гантелеобразного ядра (рис. 4.13.2, момент времени t2 ), где практически нет протонов, так как из-за кулоновского отталкивания они сосредотачиваются в удаленных от шейки частях ядра. Поэтому при разрыве шейки (рис. 4.13.2, момент времени t3 ) из нее вылетают мгновенные нейтроны. Энергия большинства мгновенных нейтронов находится в интервале от 0,1 МэВ до 10 МэВ. Запаздывающие нейтроны составляют менее 1% от числа нейтронов деления, они испускаются осколками. Среднее время запаздывания нейтронов не превышает 1 часа. Осколки деления ядер радиоактивны, они пересыщены нейтронами и находятся в возбужденном состоянии. Возбуждение осколков снимается испусканием запаздывающих нейтронов и γ - квантов, если энергия возбуждения больше, чем энергия отделения нейтрона из ядра. Наличие запаздывающих нейтронов имеет важное практическое значение, так как с помощью специальных процессов позволяет регулировать цепную ядерную реакцию. При делении 235 92 U выделяется огромная энергия, которая распределяется следующим образом. 166, 2 МэВ Кинетическая энергия осколков деления K ( ZA11Y , ZA22 Y )
Энергия мгновенных и запаздывающих нейтронов 4, 8 МэВ 8, 0 МэВ Энергия мгновенных γ -квантов Энергия быстрых электронов 7, 0 МэВ 7, 2 МэВ Энергия γ - квантов, вылетающих из осколков Энергия антинейтрино 9, 6 МэВ ---------------------------Итого 202, 8 МэВ
314
4.15. Цепная ядерная реакция Реакция деления тяжелых ядер нашла широкое практическое применение. Важнейшее значение имеет высвобождение большого количества энергии, которое имеет место при каждом акте деления, и появление при этом двух или трех мгновенных нейтронов. Если бы каждый из этих нейтронов, взаимодействуя с ближайшими ядрами делящегося вещества, в свою очередь, вызывал в них реакцию деления, то в природе происходило бы лавинообразное нарастание числа актов деления. Возникла бы цепная ядерная реакция. Но предположение, что каждый из нейтронов захватывается делящимися ядрами, в действительности не реализуется. Большинство мгновенных нейтронов попадает в ядра атомов, которые под действием нейтронов вообще не делятся. Некоторое их число может просто выйти за пределы активной зоны, т. е. той части пространства, в которой происходит цепная реакция. Эти потери могут быть столь значительными, что в объеме рабочего вещества цепная реакция либо вовсе не возникает, либо, возникнув, быстро затухает. Рассмотрим сначала размножение нейтронов в бесконечной среде делящегося вещества. Размножение нейтронов удобно представить в виде ряда циклов размножения. Для примера пусть это будет вещест238 во, состоящее из смеси изотопов 235 92 U и 92 U . Отдельный цикл размножения состоит из последовательных этапов: поглощение ядрами 235 235 238 92 U тепловых нейтронов, деление 92 U , деление 92 U быстрыми нейтронами. Если бы не было поглощения и утечки нейтронов за пределы объема, то размножение нейтронов происходило бы по схеме, показанной на рис. 4.15.1. 1 − е поколение
2 − е поколение
3 − е поколение
Рис. 4.15.1. Схема размножения нейтронов в цепной реакции деления
315
Для характеристики цепной реакции вводится коэффициент использования тепловых нейтронов θ . θ показывает, какое относительное число тепловых нейтронов поглощается ядрами 235 92 U . Так как некоторое число нейтронов теряется в замедлителе, то θ < 1 . Размножение на тепловых нейтронах характеризуется коэффициентом размножения k . k есть отношение числа нейтронов во втором поколении к числу нейтронов в первом поколении с учетом всех возможных потерь нейтронов. С уменьшением размеров активной зоны увеличивается число нейтронов, выходящих за ее пределы, при этом уменьшается возможность дальнейшего развития цепной реакции. Так как число нейтронов, выходящих за пределы активной зоны, пропорционально площади поверхности, а число вновь возникших нейтронов пропорционально объему делящегося вещества, то оценить относительное число выходящих из цепной реакции нейтронов вследствие утечки можно из соотношения S 4πR 2 3 = = , 4 V πR 3 R 3 где S – площадь поверхности активной зоны, V – объем активной зоны. Следовательно, с уменьшением радиуса активной зоны R увеличивается число нейтронов, вылетающих из активной зоны. Минимальный размер активной зоны, при которой возможно осуществление цепной ядерной реакции, называется критическим размером. Масса делящегося вещества, находящегося в критическом объеме, называется критической массой. Величина критической массы зависит от способа ее размещения в системе. Для увеличения вероятности протекания цепной реакции возможны несколько способов размещения массы делящегося вещества, при помощи которых удается уменьшить критическую массу. Остановимся на некоторых из них. 1. Использование отражателей. Отражатель – это вещество, которое отражает выходящий за пределы критической массы нейтроны. Термин "отражатель" не вполне точен, поскольку в природе не существует материала, способного полностью отражать нейтроны в обратном направлении. Механизм работы отражателя состоит в том, чтобы нейтроны, двигающиеся беспорядочно по случайным траекториям, от объема отражателя испытывали обратное рассеяние. А поскольку коэффициент обратного рассеяния r < 1 , то в результате многократных
316
столкновений с ядрами вещества отражателя некоторое число нейтронов рассеивается в обратном направлении. Поэтому ядра отражателей не должны захватывать и поглощать нейтроны, они должны лишь рассеивать их. Отражателями являются графит, бериллий, вода, углеводороды. 2. Использование замедлителей. Замедлитель представляет собой материал, замедляющий быстрые нейтроны (мгновенные нейтроны), возникающие при делении 235 92 U . В результате столкновений быстрых нейтронов с ядрами замедлителя быстрые нейтроны в каждом акте столкновения теряют энергию, и после многократных столкновений их энергия снижается до тепловой. К замедлителям относятся графит, бериллий, вода, углеводороды, причем бериллий является одним из лучших замедлителей. При облучении бериллия нейтронами происходит следующая ядерная реакция: 9 4 Be( n,2n) 2α Замедлителем может быть также и 238 92 U для тех быстрых нейтронов, энергия которых меньше 1, 4 МэВ. Тогда при столкновении быстрого нейтрона с ядром 235 92 U деления ядра не происходит, возникает возбужденное составное ядро. 3. Тщательная сепарация – отделение делящихся ядер от других с целью снижения захвата нейтронов ядрами неделящегося вещества. Для управления цепной реакцией используются поглотители. Их изготовляют в виде стержней, которые в процессе выгорания ядерного вещества постепенно извлекают из активной зоны. Из природных элементов с большим сечением поглощения тепловых нейтронов широко применяются бор 115B и кадмий 112 48 Cd как в чистом виде, так и в различных соединениях и сплавах, а также гафний 178 72 Hf . В литературе приводятся значения критических размеров и критических масс чистых нуклидов. Они представлены в табл. 4.15.1. Нуклид
233 92
Rкр , см
6
8,5
6
mкр , кг
16
48
17
U
235 92
U
239 94
Pu
Таблица 4.15.1. Критические размеры и массы нуклидов
317
Найдем теперь закон размножения нейтронов в активной зоне. Пусть N1 = N – число нейтронов в первом поколении. Тогда во втором поколении число нейтронов будет N 2 = k ⋅ N , k – коэффициент размножения нейтронов. Прирост числа нейтронов за одно поколение за время t = τ будет ∆N = N 2 − N1 = k ⋅ N − N = N ⋅ (k − 1) , где τ – среднее время между двумя последовательными актами деления ядер. Изменение числа нейтронов в активной зоне за 1 с ∆N N (k − 1) = . (4.15.1) τ τ Обычно нейтрон в замедлителе испытывает от 20 до 180 столкновений, в процессе столкновений с ядрами замедлителя нейтрон растрачивает свою избыточную энергию. Средний промежуток между столкновениями составляет 0, 5 см < λ < 3 см , а весь процесс замед-5 -3 ления до момента захвата ядром 235 92 U длится 10 с ≤ τ ≤ 10 с , и за это время нейтрон в среднем проходит путь по ломанной траектории порядка 30 м и может удаляться от места своего возникновения на расстояние от 2 см до 100 см. Поэтому с достаточной точностью в формуле (4.15.1) можно положить τ = dt и записать: ∆N dN = . τ dt После подстановки найденного значения в (4.15.1) получаем дифференциальное уравнение dN (k − 1) = N , (4.15.2) dt τ решением которого является ⎛ k −1 ⎞ (4.15.3) N = N 0 exp⎜ t⎟ , ⎝ τ ⎠ где N 0 – число актов деления в начальный момент реакции, N – число активных нейтронов в момент времени t , τ – средний промежуток времени между двумя последовательными актами деления ядра 235 92 U . Из уравнения (4.15.3) видно, что закон изменения числа активных нейтронов от времени существенно зависит от величины коэффициента размножения нейтронов k , а стало быть, и от знака скобки (k − 1) . Здесь могут встретиться три частных случая:
318
•
k - 1 > 0 , k > 1, N > N 0 , число нейтронов со временем растет; это развивающаяся цепная реакция. • k - 1 = 0, N = N 0 , число нейтронов во времени не меняется; это самоподдерживающаяся цепная реакция. • k - 1 < 0, k < 1, N < N 0 , число нейтронов со временем убывает; это затухающая цепная реакция. Для получения управляемой цепной реакции необходимо иметь коэффициент размножения k ≈ 1 . В этом случае число активных нейтронов будет меняться столь незначительно, что таким потоком нейтронов легко управлять. Для этого в активную зону вводят специальные стержни – замедлители ядерной реакции. Вводя и выводя из активной зоны такие стержни, можно управлять ходом цепной реакции, делая ее самоподдерживающейся. В зависимости от величины коэффициента размножения k можно получить три режима работы: k = 1 – критический режим, k > 1 – надкритический режим, k < 1 – подкритический режим. Система, состоящая только из ядер 238 92 U , не может находиться в критическом режиме, поскольку у 238 92 U вероятность поглощения быстрого нейтрона с энергией ε к > 1,4 МэВ и последующего деления составного ядра меньше вероятности неупругого рассеяния быстрого нейтрона примерно в 3 раза. Таким образом, 238 92 U очень хорошо осуществляет неупругое рассеяние по схеме 238 238 * 92 U ( n, n') 92 U ,
при этом потеря энергии у быстрых нейтронов происходит за весьма короткое время. Для протекания самоподдерживающейся ядерной реакции необходимо k = 1 . Но в данном случае из трех нейтронов только один вызовет деление, а два испытают неупругое рассеяние. Значит, величина k = 1 может быть только в идеальном случае, а с учетом возникающих здесь дополнительных потерь реальное значение k оказывается меньше единицы. Таким образом, получается, что при k = 1 цепная реакция оказывается затухающей. Итак, для того чтобы цепная самоподдерживающаяся ядерная реакция шла на быстрых нейтронах, необходимо, чтобы коэффициент размножения k > 1 , а само делящееся вещество было бы обогащено ядрами 235 92 U или ядрами другого делящегося под действием тепловых нейтронов вещества.
319
4.16. Реакции синтеза легких ядер 4.16.1. Термоядерные реакции Ранее мы подробно рассмотрели процесс деления тяжелых ядер, возникающий в результате поглощения тяжелым ядром одного нейтрона. Такое ядро делится на два осколка, обладающих огромной кинетической энергией, и, кроме того, в пространство вылетают два или три мгновенных нейтрона. Общая энергия, которая выделяется в результате реакции деления тяжелых ядер, составляет примерно 200 МэВ. Но, наряду с делением тяжелых ядер, в природе существуют реакции синтеза, т.е. реакции образования более тяжелых ядер из легких, сопровождающехся выделением энергии большей, чем при реакции деления. Для того чтобы понять физическую причину выделения большой энергии в процессе синтеза легких ядер, обратимся еще раз к анализу ε графика св , приведенного на рис. 4.3.1. Из опыта следует: A ε ε св 2 1 ε (1 H ) = 1,2 МэВ, св (13H 2 ) = 1,8 МэВ, св ( 24He2 ) = 7,2 МэВ. A A A ε св 4 2 ( 2 He ) A ε далеко выходит за пределы графика усредненных значений св . ПоA 2 1 4 2 этому, если из двух нуклонов 1 H образуется ядро 2 He , то такое ядро должно находиться в возбужденном состоянии, поскольку при этом высвобождается энергия, равная энергии связи. Нечто подобное имеет место и при синтезе других легких ядер. Конечно, было бы заманчивым в какой-то точке пространства вызвать столкновение сразу четырех протонов с последующим образованием ядра атома гелия. Однако такое четверное столкновение – событие маловероятное, оно осуществляется чрезвычайно редко. Поэтому гораздо проще осуществить столкновения двух дейтронов с последующим образованием ядра 4 2 2 He . Возможные ядерные реакции синтеза будут иметь следующий вид:
Как видно из рис. 4.3.1, экспериментальное значение
320 2 1 2 1 3 2 1 0 1 H + 1 H →1 H +1 H + 4,03 2 1 2 1 3 1 1 1 1 H + 1 H → 2 He + 0 n + 3,25 2 1 3 1 4 2 1 1 1 H +1 H → 2 He + 0 n + 17,6
МэВ , МэВ ,
МэВ . Из приведенных ядерных реакций мы видим, что при этом выделяется значительная энергия. Следует подчеркнуть, что в этих реакциях выделение энергии в расчете на единицу массового числа A в несколько раз превышает выделение энергии, которое имеет место при реакции деления тяжелых ядер, например, 235 92 U , под действием нейтрона. В самом деле, применительно к этому случаю, мы можем записать: A1 A2 235 1 236 * 92 U + 0 n →( 92 U )→ Z 1 Y + Z 2 Y + k ⋅ n + 205 МэВ , где k = 2 или 3 . Но A = A1 + A2 + k = 236 , поэтому
ε * A = 205 236 = 0,85 МэВ . В случае же реакции синтеза имеем 3 2 1 4 1 H (1 H , 0 n) 2 He + 17,6 МэВ , и A = 4 + 1 = 5 . Тогда ε* A = 17,6 5 = 3,5 МэВ . Таким образом, при реакции синтеза высвобождение энергии на один нуклон оказывается примерно в четыре раза больше, чем при реакции деления. И если сравнивать между собой ядерную реакцию деления с ядерной реакцией синтеза, то между этими реакциями с энергетической точки зрения нет принципиальной разницы: реакция синтеза в расчете на одну а.е.м. дает выигрыш в энергии примерно в четыре раза больше по сравнению с реакцией деления. Тем не менее, в настоящее время ученые многих стран стремятся овладеть управляемой реакцией синтеза. В чем же здесь причина? А дело здесь в том, что исходный продукт реакции синтеза в природе встречается в очень большом количестве. Известно, что в природной воде всегда в небольшом количестве имеются изотопы дейтерия и трития. Так, 1 л воды содержит 0, 033 л дейтерия, а всего в океанах Земли содержится около 5 ⋅ 1013 т дейтерия. При современном уровне энергетических потребностей запасов дейтерия на Земле могло бы хватить на 20 миллиардов лет. И если человечество сумеет овладеть этой реакцией, заставит ее служить на свою пользу, то оно на многие столетия вперед освободит себя от заботы о дешевом источнике энергии. Тогда во
321
многих странах проблема энергетического голода не будет стоять так остро, как сейчас. Вот почему взоры всех ученых энергетиков привлекает заманчивая картина овладения термоядерной реакцией синтеза. В чем же состоит особенность реакций синтеза легких ядер? Синтез должен осуществляться либо из легких ядер, либо из нуклонов. ε При этом у них отношение св должно находиться на возрастающей A части графика рис. 4.3.1. К нуклонам, как мы знаем, относятся лишь протоны и нейтроны. Однако нейтроны в свободном состоянии в природе не существуют. Поэтому синтез ядер из нейтронов в природных условиях осуществить в заметных количествах не удается, это можно сделать только из протонов, а также из ядер дейтерия и трития. Но ядра этих изотопов имеют электрический заряд. Поэтому в ядерных реакциях синтеза существенную роль играют кулоновские силы отталкивания, препятствующие преодолению потенциального барьера между сталкивающимися частицами. Если полная кинетическая энергия сталкивающихся частиц невелика, то ядерная реакция на заряженных частицах не произойдет вообще. У легких ядер кулоновский потенциальный барьер сравнительно невысок, но все же для сближения двух дейтронов и последующего образования ядра атома 24 He необходимо, чтобы их полная кинетическая энергия была не менее 0,1 МэВ. В самом деле, для того чтобы произошел синтез двух дейтронов, их необходимо сблизить на расстояние около 3 Ф , т.е. на удвоенный радиус сталкивающихся дейтронов. На таком расстоянии между ядрами потенциальная энергия отталкивания e2 ε пот = . (4.16.1) 4πε0 (2 R) max Так как столкновения дейтронов в большом количестве возможны только в достаточно плотной среде, то для осуществления такой реакции необходима кинетическая энергия сталкивающихся дейтронов 3 (4.16.2) ε к = kT . 2 Решая уравнения (4.16.1) и (4.16.2) совместно, получим e2 T= . (4.16.3) 12πε0 kR
322
После подстановки в (4.16.3) табличных значений, а также R = 1, 5 Ф и выполнения вычислений получаем T = 3,7 ⋅109 K . Эта температура столь высока, что превышает температуру в центральной
области Солнца, которая примерно равна 1,5 ⋅107 K . Так как процессы слияния ядер в массовом количестве возникают лишь в результате хаотических столкновений при очень высокой температуре, то рассмотренные выше реакции синтеза называются термоядерными реакциями. Таким образом, термоядерные реакции – это реакции синтеза атомных ядер, эффективно протекающие при сверхвысоких температурах и способствующие поддержанию этой температуры за счет большого энерговыделения. Для поддержания термоядерной реакции необходима температура порядка 109 К, а в то же время в центральной области Солнца температура достигает величины порядка 107 К. Тем не менее считают, что огромная энергия, излучаемая Солнцем в окружающее пространство, возникает за счет протекающих в нем термоядерных реакций. Так в чем же здесь дело? Оказывается, реакции синтеза могут протекать и при температуре, значительно меньшей, чем 109 К. Правда, при этом в реакции должны участвовать только ограниченное число ядер. Рассмотрим более подробно эти процессы. 1. Если два дейтрона 12 H движутся навстречу друг другу, то они могут преодолеть потенциальный барьер сил отталкивания туннельным эффектом и затем войти в соприкосновение и испытать слияние, образуя ядро атома гелия, α - частицу. На протекание такого процесса требуется энергия в 10–100 раз меньшая, чем при прямом слиянии ядер дейтерия. Известно, чем больше энергия налетающей частицы, тем меньше толщина потенциального барьера, тем больше становится вероятность преодолеть такой барьер туннельным эффектом. Оценки показывают, что вероятность таких столкновений имеет заметную величину. 2. При достаточно высокой температуре оголенные ядра дейтерия имеют максвелловское распределение по скоростям. Ядра, у которых скорости хаотического движения во много раз больше их средних скоростей в распределении Максвелла, обладают настолько большой энергией, что при их столкновении может произойти синтез ядер атомов гелия (рис. 4.16.1). Из рис. 4.16.1 видно, что, хотя количество таких ядер и невелико, они в объеме все-таки существуют.
323
f (υ )
υ н.в.
υ
υ
Рис. 4.16.1. Распределение Максвелла по скоростям движения Таким образом, в плазме, состоящей из оголенных ядер и электронов при температуре 107 К, всегда имеются частицы с энергией, достаточной для возбуждения термоядерной реакции. Вот почему температура, при которой могут реально происходить термоядерные реакции синтеза, находится в интервале 107 − 108 К . Итак, для протекания термоядерной реакции синтеза легких ядер в объеме необходима температура порядка 107 К и наличие условий, при которых количество энергии, выделяющейся при термоядерной реакции, превышало бы возможные энергетические потери. Если же энергетические потери будут превышать выделяющуюся энергию, то температура плазмы будет постепенно понижаться, и реакция синтеза в конце концов прекратится. В настоящее время в земных условиях такая температура может быть создана либо при помощи взрыва атомной бомбы, либо с помощью магнитных ловушек, которые позволяют сконцентрировать плазму в малом объеме, отделив ее при этом от стенки экспериментальной установки и тем самым уменьшив различные виды потери энергии, возникающие при контакте горячей плазмы со стенкой. Но работа на термоядерных реакторах как в стационарном, так и в импульсном режимах при генерации избыточной энергии в настоящее время не привела пока к положительным результатам. Физической причиной возникающих трудностей является наличие в объеме горячей плазмы множества мелкомасштабных неустойчивостей, нарушающих стабильную работу реактора.
324
4.16.2. Термоядерные источники энергии Солнца Спектроскопические исследования показывают, что в состав Солнца входят протоны (80%), ядра атомов гелия (19%) и ядра атомов углерода, азота, кислорода – всего 1%. Поэтому главное значение для поддержания постоянства излучения Солнца имеют реакции синтеза ядер водорода. В настоящее время принято, что на Солнце осуществляются два цикла синтеза легких ядер: а. протонно-протонный цикл
1. 11H +11H →12H + +1e + ve + 0,421 МэВ , 1 1 2 1 H +1H →1 H + +1e + ve 10
t = 1,4 ⋅ 10 2.
+1 e + −1e →
+1 e + −1e →
+ 0,421 МэВ ,
лет, t – средняя продолжительность реакции.
γ + 1,02 МэВ ,
γ + 1,02 МэВ , t = 0 .
3. 12 H +11H → 23He + γ + 5,49 МэВ , 2 1 3 1 H +1 H → 2 He +
4.
γ + 5,49 МэВ , t = 5,7 с .
3 3 4 1 2 He+ 2 He→ 2 He + 21 H
+ 12,85 МэВ , t = 1⋅ 106 лет.
Следовательно, полная энергия, выделяющаяся за 1 цикл, Q = 26,71 МэВ. Тогда все реакции синтеза протонно-протонного цикла можно сокращенно записать в виде одной обобщенной: 411H →24He + 2+1 e + 2ve + 2 γ + Q . б. углеродно-азотный цикл Этот цикл достаточно интенсивно протекает лишь при более высокой температуре, чем протонно-протонный. Поэтому условия для его осуществления в недрах Солнца менее благоприятные. Углеродноазотный цикл состоит из шести последовательных циклов, причем каждый из них имеет свою продолжительность. 1. 126C +11H →137N + γ + 1,95 МэВ , t = 1,3 ⋅ 10 лет. 2.
13 13 7 N → 6 C + +1e + ve
3.
13 1 14 6 C +1H → 7 N
4.
14 1 15 7 N +1H → 8 O +
5.
15 15 8 O → 7 N + +1e + ve
+ 2,2 МэВ , t = 7 мин.
+ γ + 7,54 МэВ , t = 2,7 ⋅ 106 лет.
γ + 7,35 МэВ , t = 3,3 ⋅ 108 лет. + 2,71 МэВ , t = 82 c.
325 15 1 12 4 7 N +1H → 6 C + 2 He + 4,96
5
6. МэВ , t = 1,1 ⋅ 10 лет. В итоге при сокращенной форме записи имеем: 411H → 24He + 2 +1 e + 2ve + 3γ + 26,73 МэВ . Ядро
12 6C
является реагентом, оно синтезирует ядро 24 He из четы-
рех протонов. Так как температура в ядре Солнца порядка 107 К, то в нем преимущественно протекает протонно-протонный цикл. При более высокой температуре, по-видимому, будет преобладать углеродноазотный цикл. Стало быть, для поддержания равновесного состояния возникают условия, при которых энергетические потери в окружающую среду равны энергии, выделившейся в результате реакций синтеза. В 1967 г. немецкому ученому Хансу Бете была присуждена Нобелевская премия за его вклад в теорию ядерных реакций, особенно за открытия, относящиеся к источникам энергии звезд. Из приведенных выше термоядерных реакций синтеза следует, что одним из побочных продуктов реакций являются нейтрино. Наибольший поток нейтрино будет вылетать из тех объемов ядра Солнца, где наиболее интенсивно протекают термоядерные реакции, т.е. из областей ядра Солнца с наиболее высокой температурой. Следовательно, изучая распределение нейтрино в пространстве по направлениям, можно определить размеры ядра Солнца, интенсивность термоядерных реакций и объем, в пределах которого они протекают. Разогретая плазма в ядре Солнца удерживается в сжатом состоянии внешними гравитационными силами, действующими снаружи на ядро Солнца. Этим обеспечивается естественное течение самоподдерживающихся термоядерных реакций. В результате протекания термоядерных реакций синтеза содержание протонов в Солнце постепенно уменьшается, и после того, как весь водород выгорит, термоядерные реакции прекратятся, излучение Солнца постепенно будет затухать. Но процесс этот весьма и весьма длительный, он займет многие миллиарды лет.
326
Приложение
Рассмотрим многоэлектронный атом, в электронной оболочке которого имеется лишь один валентный электрон. Для наглядности такой атом можно представить состоящим из остова, т.е. ядра с электрическим зарядом Ze > 0 и электронной оболочки с зарядом (Z - 1)e < 0 , и валентного электрона с зарядом e < 0 . Следовательно, эффективный электрический заряд остова атома q* = e > 0 . Так как электронная оболочка атома не обладает сферической симметрией, то электрическое поле остова атома должно отличаться от кулоновского, оно не обладает сферической симметрией. В результате вырождение состояний по орбитальному квантовому числу λ теперь снимаются, каждому значению λ соответствует свое значение полной энергии электрона. Движущийся вокруг остова атома валентный электрон создает орбитальный ток I e (рис. 1). Z
ρ Bλ ρ pmλ Iλ q* > 0
ρ
Rλ
υ( + e) e<0
ρ
υ( − e)
Рис. 1 По определению, вектор мгновенного орбитального магнитного момента
ρ ρ pmλ = I e sk где
327
Iλ =
e >0 Tλ
Tλ - период обращения валентного электрона вокруг остова, Rλ радиус мгновенной окружности, по которой движется валентный ρ электрон; k - единичный вектор, направленный вдоль оси oz . Мгновенный орбитальный ток создает магнитное поле, вектор индукции которого на оси симметрии
ρ ρ Bλ = Bλk
ρ
На рис. 1 υ ( − e ) - вектор мгновенной скорости валентного электро-
ρ
на, υ ( + e ) -вектор скорости воображаемого положительного заряда, направление движения которого совпадает с направлением мгновенного тока I λ , υ ( − e ) = υ ( + e ) .
ρ
Но кроме мгновенного орбитального магнитного момента pmλ у
ρ
электрона всегда имеется собственный магнитный момент pms , возникающий в результате вращения электрона вокруг оси симметрии с ρ угловой скоростью ω s (рис. 2).
ρ
Rs
ωs
ρ
ωs
Рис. 2
328
По определению, собственный магнитный момент электрона
pms = I s ss где
Is =
e , Ts
Ts - период вращения электрона вокруг оси симметрии, Rs - радиус электрона. Тогда
pms =
e πRs2 Ts
Собственный момент импульса электрона
Ls = Iω s
где 2
mR I= e s , 2
ω
I - момент инерции электрона относительно собственной оси
вращения, ω s - угловая скорость вращения электрона вокруг собственной оси вращения. Следовательно, отношение собственного магнитного момента к собственному моменту импульса есть −1
⎛ m R 2 2π ⎞ pms e e ⎟ = = πRs2 ⎜⎜ e s = gs ⎟ Ls Ts T m 2 s e ⎝ ⎠ или
pms = g s Ls
g s - гиромагнитное отношение электрона.
329
Движение валентного электрона по воображаемой орбите можно представить в виде движения по мгновенной круговой траектории, результатом которого является возникновение мгновенного кругового тока. Вектор индукции магнитного поля такого кругового тока
ρ µ0 pρmλ Bλ = 2π r 3 Но так как
pmλ =
e πR 2 λ Tλ
Lλ = me Re2
то после подстановки соответствующих значений имеем
pmλ e = = gλ Lλ 2me
gλ =
e - гиромагнитное отншение при орбитальном движении 2me
электрона вокруг остова атома. Тогда
pmλ = g λ Lλ
Из сравнения (2) и (3) находим
g s = 2 gλ
Наличие у электрона собственного магнитного момента приводит к изменению его полной энергии. Для оценки такого изменения введем собственную для электрона систему отсчета. В этой системе отсчета остов атома вращается вокруг электрона. В результате теперь элек-
330
трон находится в магнитном поле, созданном движущимся эффективным зарядом q* остова(рис. 3). z = z1
q* > 0 ρ
υq
e<0
*
Iλ
y1
x1
Рис. 3 В месте расположения электрона вектор индукции магнитного поля с учетом (4)
ρ ρ µ Bλ = 0 3 g λLλ 2πr
Теперь валентный электрон находится в магнитном поле, созданным самим же электроном в результате орбитального движения вокруг остова атома, поэтому у валентного электрона возникает дополнительное изменение полной энергии
ρ ρ ∆ε = − pms Bλ ρ ρ или после подстановки значений pms и Bλ получаем
∆ε = − g s g λ ρρ
ρρ µ0 ρ ρ 2 µ L L = − g λ 03 Ls Lλ 3 s λ 2πr πr
Скалярное произведение Ls Lλ найдем, используя соответствующие формулы квантовой механики. Для валентного электрона справедливо равенство
ρ ρ ρ L j = Ls + Lλ
из которого следует
ρ2 ρ ρ ρ ρρ ρ L j = L j ⋅ L j = Lλ2 + 2 LλLs + Ls2
331
Откуда
ρρ 1 ρ ρ ρ LλLs = L 2j − Lλ2 − Ls2 2
(
) (8)
Так как
ρ ˆ L2jψ j = L2jψ j
ρ ˆ Lλ2ψ λ =
Lλ2 = η2 j ( j + 1) Lλ2 = η2 λ(λ + 1) Ls2 = η2 s ( s + 1) j - внутреннее квантовое число, то после постановки найденных значений в (8) получаем
ρρ ρρ η2 Ls Lλ = − LλLs = − ( j ( j + 1) − λ(λ + 1) − s ( s + 1) ) 2
(9)
ρρ
Значение Ls Lλ из (9) подставляем в (7):
µ0η2 ( j ( j + 1) − λ(λ + 1) − s( s + 1) ) ∆ε = g πr 3 2 λ
Итак, изменение полной энергии (10), возникающее из-за спинорбитального взаимодействия, зависит от значений квантовых чисел j , λ , s . Кроме того, с ростом Z радиус орбиты валентного электрона r возрастает, поэтому возможное расщепление уровней полных энергий должно быть значительным только у атомов с малым Z , что и подтверждается опытом.
332
Предметный указатель
Автоэлектронная эмиссия, 69 Адиабатическое приближение, 169 Адроны, 273 Активная зона делящегося вещества, 353 Активность препарата, 317 Акцепторный уровень, 195 Атомная единица массы (а.е.м.), 282 Барионная асимметрия Вселенной, 278 Барионный заряд, 284 Барионы, 284 Безизлучательный переход, 249 Беккерель, 317 Бета-распад позитронный, 331 электронный, 331 Бозоны, 274 Валентный электрон, 92 Вековое уравнение, 319 Вектор трансляции, 171 Вероятность события, 23 Вероятность спонтанного перехода, 237 Взаимодействие обменное между атомами, 117 Взрывная миссия, 256 Виртуальнй фотон, 290 Виртуальные пи-мезоны, 303 Виртуальный процесс обмена частицами, 289 Внешняя контактная разность потенциалов, 201 Внутреннее квантовое число, 104 Внутренний фотоэффект, 227 Внутренняя контактная разность потенциалов, 206 Волновая функция, 20 Волновое спектроскопическое число, 91 Волновой вектор, 172
Вращательные энергетические уровни, 124 Время жизни атома в возбужденном состоянии, 237 Входной и выходной каналы ядерной реакции, 337 Вырожденние состояний в атоме водорода, 83 Вырожденные состояния электронов в твердом теле, 138 Гармонический осциллятор квантовый, 48 классический, 45 Гетеропереход, 252 Гиромагнитное отношение, 84 Глюоны, 275 Гравитационное взаимодействие, 274 Граничные условия, 55 Деление ядра, 342 Дефект массы, 281 Диамагнетизм сверхпроводников, 162 Диоды полупроводниковые, 223 Диффузионная длина неосновных носителей заряда, 217 Диффузионный поток квазичастиц, 202 Длина волны де Бройля, 14 Донорный уровень, 192 Дырки, 182 Закон Гейгера-Нэттола сохранения барионного заряда, 331 Замедлитель, 356 Запаздывающие нейтроны, 352 Заряд лептонный, 275 мюонный, 275 таонный, 275
334
Зарядовая независимость ядерных сил, 284 Зона валентная, 176 запрещенная, 176 проводимости, 176 Зоны Бриллюэна, 173 Изобары, 279 Изотопы, 279 Импульс фотона, 13 Инверсная населенность, 243 Индуцированные переходы, 239 Инжекция носителей заряда, 225 Интеграл обменного взаимодействия, 118 Интегральные микросхемы, 226 Ионные кристаллы, 127, 129 Квазиимпульс электрона, 228 Квазиэлектроны, 151 Квантовый выход фотоэффекта, 233 Квантовый дефект главного квантового числа, 94 Квантовый осциллятор, 48 Кварки, 275 К-захват, 332 Классический осциллятор, 45 Ковалентные кристаллы, 127, 130 Колебания ионов аккустические, 150 оптические, 150 тепловые, 150 Колебательное квантовое число, 121 Контакт металл полупроводник, 209 Концентрация носителей заряда в полупроводнике примесном, 199 собственном, 196 Коэффициент выпрямления, 222
прозрачности потенциального барьера, 261 Коэффициенты Эйнштейна, 240 Критическая масса делящегося вещества, 354 температура сверхпроводника, 161 Куперовская пара (к. п.), 162 Кюри (единица активности нуклида), 317 Лазер гелий-неоновый, 243 полупроводниковый, 251 с двойной гетероструктурой, 253 Лазеры, 236 Лептон, 271 Магические числа нуклонов, 283 Магнитное квантовое число, 77 Масса эффективная электронов, 157 Массовое число, 279 Массой эффективная дырок, 183 Мгновенные нейтроны, 352 Металлические кристаллы, 132 Метод разделения переменных Фурье, 51 Модель жидкой капли, 291 ядерных оболочек, 304 Молекулярные кристаллы, 132 Насыщение ядерных сил, 286 Невырожденые состояния электронов в твёрдом теле, 138 Нейтроны запаздывающие, 352 мгновенные, 352 Нестационарное уравнение Шредингера, 40 Носители заряда
335
неосновные, 195 основными, 195 Нуклид, 278 Нулевая энергия, 49 Нулевые колебания, 50 Обменное взаимодействие между нуклонами, 288 Оператор Гамильтона, 41 импульса, 42 момента импульса, 73 Оптрон, 236 Оптронная пара, 235 Орбитальное квантовое число, 76 "Островок" стабильности изотопов, 315 Относительный показатель преломления в электронной оптике, 12 Отражатель, 354 Переход электронно-дырочный (n-p), 203 Период полураспада, 280 Плотность вероятности, 25 Плотность тока квазиэлектронов и дырок, 220 Плотность энергии равновесного излучения абсолютно черного тела, 241 Подвижность электронов, 135 Полная энергия электрона в атоме водорода, 82 в молекуле водорода, 123 Полупроводник дырочный (р-типа), 195 электронный (n-типа), 195 Полупроводниковый диод, 223 Полупроводниковый инжекционный лазер, 247 Постоянная распада, 317 Потенциальный барьер, 62 Правила отбора в дипольном излучении, 96
Приближение почти свободных электронов, 171 Принцип дополнительности, 35 Продукты деления радиоактивного распада, 350 Протонно-протонный цикл, 364 Псевдопотенциал, 170 Работа выхода, 256 Радиоуглеродный метод, 320 Распределение МаксвеллаБольцмана, 241 Режим критический, 358 надкритический, 358 подкритический, 358 Самоподдерживающаяся реакция, 358 Самосогласованное поле, 170 Сверхпроводники 1-го и 2-го рода, 166 Светодиоды, 234 Свободная энергия, 141 Связь в атомах нормальная, 103 сильная, 103 Сериальная формула атома водорода, 92 Сильное взаимодействие, 273 Синтез ядра, 281 Скорость спонтанного распада, 237 Соединения в полупроводниках, 249 Соотношение Эйнштейна, 213 Соотношения неопределенностей, 28 Составное ядро, 338 Спектрального терм атома, 94 Спин нуклона, 277 электрона, 100 Спин-орбитальное взаимодействие, 304 Спонтанное излучение, 240
336
Среднее время жизни атома в возбужденном состоянии при спонтанном переходе, 236 Средние значения физических величин, 26 Стационарное уравнениие Шредингера, 40 Структурная единица движения, 148 материи, 148 Твердый раствор, 251 Температура Дебая, 149 Тепловые нейтроны, 347 Термодинамическая вероятность, 141 Термоядерная ракция, 358 Ток обратный, 222 прямой, 222 Транзистор, 223 Туннельный эффект, 68 Углеродная единица массы, 282 Углеродно-азотный цикл, 365 Угловая скорость прецессии, 85 Управляемая цепная реакция, 357 Уравнение плоской электромагнитной волны, 19 Уравнение Шредингера в операторной форме, 41 Уровень Ферми, 162 Условие нормировки, 25 Условное обозначение нуклида, 279 Фазовое пространство координат и импульсов, 138 Ферми-газ (ЭФГ), 257 Фонон, 148 Фононный газ, 148 Формула Вейцзеккера, 295 Формула Гейгера, 330 Фотогальванический эффект, 230
Фотодиод, 230 Фотон как элементарная частица, 274 Фоторезистор, 228 Фотоэлектронная эмиссия, 264 Фотоэлемент, 234 Функция Бозе-Эйнштейна, 148 Функция Ферми-Дирака, 139 Цепная реакция, 353 Ширина запрещенной зоны, 189 Электромагнитное взаимодействие, 312 Электропроводность полупроводников, 208 Электрохимический потенциал полупроводника, 210 Элементарные частицы, 275 Энергетическая зона, 175 Энергетический поток, 22 Энергия активации, 193 возбуждения ядра, 339 квантового состояния, 142 колебания микрочастицы, 49 связи, 280 спин-орбитального взаимодействия, 107 Ферми, 153 фотона, 13 Энтропия носителей заряда примесного полупроводника, 143 собственного полупроводника, 186 системы частиц, 141 Эффект Мейснера, 161 Эффективное сечение реакции, 341 Эффективный диполь, 87 Ядерная реакция, 337