КОНСПЕКТ ЛЕКЦИЙ ПО ФИЗИКЕ Часть 3 ВОЛНЫ. ОПТИКА.ЭЛЕМЕНТЫ АТОМНОЙ ФИЗИКИ. Сост. А.Н.Яшина Лекция 3.1. Лекция 3.2. Лекция 3.3. Лекция 3.4. Лекция 3.5. Лекция 3.6. Лекция 3.7. Волновой процесс. Характеристики волны. Волновое уравнение. Упругие волны. Скорость и энергия упругой волны. Электромагнитные волны. Поляризация волн. Поляризация света. Способы поляризации. Фазовая и групповая скорости. Дисперсия. Интерференция. Условия максимума и минимума интерференции. Понятие когерентности. Временная и пространственная когерентность. Лекция 3.8. Дифракция. Зоны дифракции. Дифракция Френеля. Лекция 3.9. Дифракция Фраунгофера от щели. Дифракционная решетка. Голография. Лекция 3.10. Тепловое излучение. Формула Планка. Лекция 3.11. Тормозное рентгеновское излучение. Фотоэффект. Формула Эйнштейна. Лекция 3.12. Ядерная модель атома. Постулаты Бора. Лекция 3.13. Волновые свойства частиц вещества. Лекция 3.14. Уравнение Шрёдингера. Квантование энергии и момента импульса. Атом водорода. Лекция 3.15. Многоэлектронные атомы. Спин электрона. Распределение электронов по энергетическим уровням. Лекция 3.16. Самопроизвольное и вынужденное излучение. Лекция 3.17. Энергия молекул. Энергетические зоны в кристаллах. Лекция 3.18. Атомное ядро. Энергия связи. Ядерная энергия. 1 ВОЛНОВЫЕ ПРОЦЕССЫ. ОПТИКА. Лекция 3.1. Волновой процесс. Характеристики волны. Волновое уравнение. Представим себе цепочку, состоящую из равноотстоящих друг от друга материальных точек, которые связаны пружинками и могут движения, деформируя пружинки. Если сместить от положения равновесия какую-либо частицу, то она начнет совершать колебательное движение и, взаимодействуя через пружинки, вовлечет в колебания соседние частицы. Все частицы будут совершать колебания, тождественные с исходной, но не одновременно, а запаздывая по фазе. Таким образом, колебания будут распространяться в пространстве. Если смещение от положения равновесия частицы с координатой 0 записать 0 т cos t , (3.1.1) V то для частицы с координатой х т cos t , -----------●\/\/\/●\/\/\/●\/\/\/●\/\/\/●----------х (3.1.2) 0 х где – время, в течение которого Рис.3.1.1 возмущение распространится от источника до данной точки. Обо значим скорость распространения возмущения V . Тогда x V и (3.1.2) x т cos t . перепишется (3.1.3) V Величина х – есть та разность фаз, на которую колебания точки на расстояV нии х отстают по фазе от колебаний начальной точки. Аргумент косинуса – это фаза волны. Таким образом, фаза волны является функцией координат и времени. Аналогичным образом процесс будет протекать в упругой среде, поскольку ее частицы взаимодействуют друг с другом похожим образом. Таким образом, процесс колебаний распространяется в пространстве. При этом необходимо отметить, что переноса вещества в пространстве не происходит, частицы среды лишь колеблются около положения равновесия. Распространение в пространстве различных видов возмущений вещества и поля, проявляющееся в переносе энергии возмущения, называется волновым процессом или волной. Если речь идет о колебаниях частиц среды, то волна называется упругой. Характеристики волны. Если волна является строго синусоидальной с постоянными во времени частотой , амплитудой и начальной фазой, то она называется монохроматической. Монохроматическое колебание в каждой точке пространства длится бесконечно долго, не имея ни начала ни конца во времени. Поэтому монохроматическая волна является идеализацией и не может быть реализована в действительности. 2 В зависимости от направления колебаний частиц среды по отношению к направлению распространения волны различают волны продольные и поперечные. В продольной волне направление колебаний параллельно направлению распространения волны. В поперечной – направление колебаний перпендикулярно направлению распространения. На рис 3.1.1 показаны колебания частиц, расположенных вдоль оси х. В действительности колеблются не только эти частицы, а совокупность частиц, заключенных в некотором объеме. Распространяясь от источника, волновой процесс охватывает все новые части пространства. Геометрическое место точек, колеблющихся в одинаковой фазе, называется волновой поверхностью. Волновую поверхность можно провести через любую точку пространства, охваченного волновым процессом. Однако среди этих поверхностей существует одна особая, называемая волновым фронтом. Волновым фронтом называется волновая поверхность, отделяющая часть пространства, уже вовлеченного в волновой процесс, от области, в которой колебания еще не возникли. Волновые поверхности могут быть любой формы. В зависимости от их формы различают волны плоские, сферические и т.д. Уравнение (3.1.3) очевидно описывает волну, у которой все точки пространства с одинаковым значением координаты х колеблются в одинаковой фазе. Уравнение х = const есть уравнение плоскости. Таким образом, выражение (3.1.3) описывает плоскую волну, распространяющуюся вдоль оси х. В k . выражении (3.1.3) удобно ввести обозначение (3.1.4) V Величина k называется волновым числом. Тогда (3.1.3) перепишется m cos t kx . (3.1.5) Рассмотрим в распространяющейся волне две точки с координатами х1 и х 2 такие, что в данный момент времени разность фаз колебаний для них составляет 2 . Это значит, что смещения этих частиц в данный момент одинаковы. Расстояние между точками, разность фаз колебаний в которых равна 2 , называется длиной волны - . Из такого определения следует 1 2 t kx1 t kx2 k 2 . Поэтому, принимая во внимание связь между циклической частотой и перио 2 , запишем дом колебаний Т Т 2 V T 2 2V VT , (3.1.6) k 2 откуда следует еще одно определение длины волны. Длина волны это расстояние, которое проходит волна за время, равное периоду колебаний. Выясним смысл величины , которую мы назвали скоростью распространения возмущения в пространстве. Для этого фиксируем некоторое значение фазы, которое имеет место в момент времени t в точке с координатой х. За время dt это значение переместится на расстояние dx. Тогда t kx t dt k x dx ; dt kdx 0 . 3 dx Vх - скорость, с которой фиксированное значение k dt фазы волны перемещается в пространстве. Потому она называется фазовая скорость. Заметим, что в рассмотренном случае V x положительно, т.е. волна распространяется в направлении оси х. Очевидно, что выражение т cos t kx (3.1.7) Также описывает плоскую волну, но распространяющуюся против оси х. Запишем функцию, представляющую плоскую волну, распространяющуюся k kn , называемый волновым в произвольном направлении. Введем вектор вектором, где n - единичный вектор нормали к волновой поверхности. Пусть волновая поверхность отстоит от начала координат на расстояние l (рис.3.1.2). Тогда смещение точки, положение которой определено радиус-вектором r запишется l т cos t m cost kl . V Рис.3.1.2. Выразим l через радиус-вектор этой точки. Из рисунка видно, что l можно представить как ска лярное произведение векторов n и r l (nr ) . Тогда получим т cos t knr 0 m cos t k r 0 . (3.1.8) Для соблюдения общности мы ввели начальную фазу 0 . Поскольку можно записать то выражение (3.1.5) является частным kr k x x k y y k z z , случаем формулы (3.1.8). Кроме плоских могут существовать волны с другой формой волновой поверхности. В однородной изотропной среде волна от точечного источника представляет собой сферически расходящееся возмущение вида (3.1.9) 0 cost kr , r где 0 — постоянная, 0/r — амплитуда волны, r - расстояние от источника до данной точки. Ее волновые поверхности являются сферическими. Отметим, что в выражении (3.1.8) стоит именно k (волновое число), а не волновой вектор k , как для плоской гармонической волны. Как видно из (3.1.8), амплитуда сферической волны уменьшается с удалением от источника. Следовательно, Волновое уравнение. Прямой подстановкой можно убедиться, что выражение для плоской волны, распространяющейся вдоль оси х (3.1.5) является решением уравне 2 1 2 ния . (3.1.10) x 2 V 2 t 2 Это уравнение называется волновым уравнением. 4 В случае, когда волна распространяется в произвольном направлении, (3.1.8) есть решение общего волнового уравнения 2 2 2 1 2 . (3.1.11) х 2 y 2 z 2 V 2 t 2 Лекция 3.2. Упругие волны. Скорость и энергия упругой волны. Скорость упругой волны. Рассмотренные нами волны в цепочке очень хорошо представляют сущность волновых процессов во всевозможных телах (стержнях, струнах и т.д.) или в сплошных средах (твердых, жидких и газообразных). В твердых телах возможны как продольные, так и поперечные волны. В жидких и газообразных, не имеющих упругости формы (модуль сдвига равен нулю) поперечные волны невозможны, возможны только продольные. При распространение волны в такой среде создаются чередующиеся сгущения и разрежения частиц, перемещающиеся в направлении распространения волны. Найдем скорость волны в тонком стержне. Под тонким имеется в виду стержень, толщина которого мала по сравнению с длиной волны λ. При малых продольных деформациях стержня справедлив закон Гука: E , (3.2.1) F где σ= x — напряжение (Н/м2), Ε — модуль Юнга (Па), ε = дξ/дх – относиS тельная деформация. Заметим, что σ, как и ε, величина алгебраическая, и знаки σ и ε всегда одинаковы: при растяжении — положительные, при сжатии — отрицательные. Рассмотрим малый элемент стержня Δx « λ в момент, Рис.3.2.1. когда при прохождении волны (длина волны ) он оказался, например, в растянутом состоянии (рис.3.2.1). Применим к этому элементу 2-й закон Ньютона: 2 xS 2 Fx x x Fx x , t где ρ — плотность материала стержня, S — площадь его поперечного сечения. В данный момент, как видно из рисунка, Fx(x + ∆х) > 0, a Fx(x) < 0. Соответствующие же значения σ в сечениях x и x + Δx положительные (растяжение). Поэтому правую часть уравнения можно переписать так: Fx x x Fx x S x x S x S x, x где учтено, что слева Fx и σ имеют разные знаки (это будет и при сжатии). Тогда уравнение движения после сокращения на Δx·S примет вид 2 t 2 / x . Остается учесть (3.2.1), после чего получим окончательно: 5 2 2 E . t 2 x 2 (3.2.2) Мы пришли, таким образом, к волновому уравнению. Это позволяет утверждать, что в стержне будет распространяться продольная волна, скорость которой легко определить, сопоставив полученное выражение с (3.1.10): (3.2.3) V E / . Заметим, что для не тонкого стержня выражение для V имеет более сложный вид и значение V оказывается больше, чем в случае тонкого стержня. Можно показать, что скорость упругих поперечных волн в неограниченной изотропной твердой среде (3.2.4) V G/ , где G — модуль сдвига среды, ρ — ее плотность. Скорость звука в жидкостях и газах. Формулу (3.2.3) можно использовать для вычисления скорости продольных волн в жидкостях и газах, в частности, звуковых волн, которые являются упругими волнами определенного частотного диапазона (20 ÷ 20000 Гц). Действительно, вырезав мысленно канал в направлении распространения плоской волны, мы можем повторить все рассуждения, приведшие нас к этой формуле. Остается только выяснить, какая величина в этом случае играет роль модуля Юнга Е. При продольных волнах в среде возникают сжатия и разрежения отдельных слоев, и закон Гука (3.2.1) в данном случае — связь избыточного давления Δр с относительным изменением длины элемента Δх цилиндрического канала Δξ/Δx — примет вид Δp = - ΕΔξ/Δx, где знак минус связан с тем, что приращения давления Δp и длины Δξ противоположны по знаку. Умножив числитель и знаменатель на площадь поперечного сечения канала, получим p EV /V , (3.2.5) где ΔV/V — относительное приращение объема рассматриваемого элемента. Перейдя к пределу, получим E Vdp / dV . (3.2.6) Объем V элемента Δx и его плотность меняются при прохождении волны, но их произведение, т. е. масса т= ρV = const. Отсюда dρ/ρ = -dV/V, значит dV Vd / . (3.2.7) После подстановки этого выражения в (3.2.6) получим Ε = dp d , и скорость волны — формула (3.2.3) — примет вид (3.2.8) V dp / d. Это выражение справедливо для волн в жидкостях и газах. Опыт показывает, что при распространении звука в газе связь между давлением и объемом определяется уравнением (3.2.9) pV const , где γ — так называемая постоянная адиабаты, равная отношению теплоемкостей газа при постоянных давлении и объеме, γ = CP/CV — величина, характерная для 6 каждого газа. Запишем дифференциал натурального логарифма выражения (3.2.9): dp dV 0, p V откуда dp/dV = - γp/V, и формула (3.2.3) принимает вид E p. (3.2.10) Таким образом, скорость звуковой волны в газе (3.2.11) V p / . Это выражение можно преобразовать к более удобному для расчетов виду, если учесть уравнение состояния идеального газа pV = (m/M)RT, где, напомним, m — масса газа, Μ — его молярная масса. Из уравнения состояния определим плотность как ρ = m/V = pM/RT, и уравнение (3.2.11) станет таким: (3.2.12) V RT / M , где R — универсальная газовая постоянная. Энергия волны. Плотность потока энергии. Интенсивность волны. Прежде всего, найдем выражение для плотности упругой (потенциальной) энергии растянутого (или сжатого) стержня. Приложим к торцу стержня, другой конец которого закреплен, растягивающую силу F(x) и будем медленно увеличивать ее от 0 до значения F0. Удлинение стержня при этом будет меняться от 0 до x. По закону Гука F(x) = κх, где κ — коэффициент упругости. Работа силы F(x) в этом процессе x x A F x dx xdx 0 0 x 2 2 . Эта работа идет на увеличение упругой энергии U стержня, значит U x 2 / 2. (3.2.13) Плотность же упругой энергии wn = U/Sl, где S и l — площадь поперечного сечения и длина стержня. Преобразуем выражение (3.2.13), учитывая, что k = F = σS, σ = Εε и ε = . Тогда х F S х E 2 U Sх. 2 2 2 Отсюда видно, что плотность упругой энергии wn E 2 / 2. (3.2.14) При прохождении продольной волны в стержне каждая единица объема его обладает как потенциальной энергией упругой деформации wπ, так и кинетиче2 1d dt ской энергией wK= . Плотность полной энергии 2 2 Е 2 d dt w wп wк . (3.2.15) 2 2 Для тонкого стержня Ε = ρV2, согласно (3.2.3), и выражение (3.2.15) можно переписать так: 7 2 w V . 2 t x 2 2 (3.2.16) Можно показать, что оба слагаемых равны друг другу, т. е. плотности кинетической и упругой энергии одинаковы и изменяются синфазно. Поэтому мы имеем в результате 2 d w (3.2.17) dt В частности, для гармонической волны = т cοs(ωt - kx) (3.2.18) w 2т 2 sin 2 t kx . Соответствующее распределение w(x) вдоль стержня в некоторый момент показано на рис.3.2.2. Среднее значение плотности энергии за период (или за время значительно большее периода колебаний) равно Рис.3.2.2. 2 2 w т / 2, (3.2.19) поскольку среднее значение квадрата синуса равно ½. Полученные формулы справедливы и для упругих волн в жидкостях и газах. Плотность потока энергии. Так как энергия перемещается в среде вместе с возмущением, вводят понятие потока энергии Ф. Это количество энергии, переносимое волной через определенную поверхность S в единицу времени: Ф dW / dt , (3.2.20) где dW — энергия, переносимая через данную поверхность за время dt. Поток энергии в разных точках поверхности S может иметь различную интенсивность. Для характеристики этого обстоятельства вводят понятие плотности потока энергии. Это поток энергии через единичную площадку, перпендикулярную к направлению переноса энергии: j dФ / dS , (3.2.21) где dФ = dW/dt, a dW — это энергия, заключенная внутри косого цилиндра с основанием площадью dS и образующей длиной Vdt, где V — скорость переноса энергии (или скорость волны). Размеры этого цилиндра должны быть настолько малы, чтобы во всех его точках плотность энергии w была бы одинаковой. Тогда dW = wdV, dV — объем данного цилиндра, и мы можем записать: Рис.3.2.3. dW wVdtdS cos wVdtdS . С учетом этого соотношения выражение (3.2.21) примет вид: j wV . (3.2.22) 8 Для определения плотности потока и его направления вводят вектор Умова Пойнтинга j : (3.2.23) j wV где V — вектор скорости, нормальный к волновой поверхности в данном ме сте. Для гармонической волны V = (ω/k) n . В случае монохроматической волны вектор j , как и плотность энергии, изменяется со временем по закону квадрата синуса (3.2.18). Поэтому среднее по времени значение модуля вектора Умова - Пойнтинга с учетом (3.2.19) можно записать как 1 (3.2.24) j a 2 2V 2 Это выражение справедливо для волн любого вида — плоской, сферической, цилиндрической, затухающих и др. Среднее по времени значении модуля плотности потока энергии называют интенсивностью волны: I=<j>. Зная вектор Умова - Пойнтинга во всех точках интересующей нас поверхности S, можно найти поток энергии сквозь эту поверхность. Для этого разобьем мысленно поверхность S на элементарные участки dS. Поток энергии через этот участок, согласно (3.2.21), есть dФ jdS jdS cos j dS jn dS , где jn — проекция вектора j на нормаль n к элементу поверхности dS. Тогда полный поток энергии сквозь поверхность S Ф j dS jn dS , (3.2.25) S S здесь dS dSn . Выражение (3.2.25) означает, что поток энергии равен потоку вектора j сквозь эту поверхность S. Стоячие волны. . При распространении в упругой среде одновременно нескольких волн возникает их наложение, причем волны не возмущают друг друга: колебания частиц среды оказываются векторной суммой колебаний, которые совершали бы частицы при распространении каждой из волн в отдельности. Это называют принципом суперпозиции (наложения) волн. Рассмотрим практически важный случай, когда две гармонические волны с одинаковыми частотой ω и амплитудой т распространяются в противоположных направлениях оси х : 1 т cos t kx 2 т cos t kx . Чтобы не усложнять формулы, начала отсчета времени и координаты выбраны так, чтобы начальные фазы для обеих волн были равны нулю. Суперпозиция этих волн дает: где A= 2 т . (3.2.26) 1 2 A cos kx cost, Это и есть уравнение стоячей волны. Видно, что ее частота та же, т.е. ω, а амплитуда равна (Acoskx) и, в отличие от бегущей гармонической волны, за9 висит от x. В точках, где |coskx| = l, мы имеем максимумы — пучности, а где coskx = 0 — минимумы — узлы. Период |coskx| равен π, поэтому kΔx = π и Δх = π/k = λ/2. Т. е. интервалы между соседними пучностями или узлами равны Рис.3.2.4. половине длины волны (см. рисунок 3.2.4,где показаны крайние смещения ξ через половину периода). Между двумя соседними узлами все точки среды колеблются синфазно, при переходе же через узел фаза изменяется на π, т. е. колебания по разные стороны от узла (в пределах полуволны) происходят в противофазе. Узлы смещения как бы разделяют среду на автономные области, в которых гармонические колебания совершаются независимо. Никакой передачи движения из одной области к другой, а значит и перетекания энергии через узлы не происходит. Другими словами, нет никакого распространения возмущения вдоль оси х. Именно поэтому возмущения, описываемые формулой (3.2.26), и называют стоячей волной. Энергия стоячей волны. Переходя к распределению энергии в стоячей волне, определим сначала с помощью (3.2.26) выражение для скорости d частиц среды и ее относительdt ной деформации ε = dξ/dx: d A cos kx sin t , Ak sin kx cost. (3.2.27) dt Видно, что обе величины, d dt и ε, тоже стоячие волны, причем они сдвинуты относительно друг друга по фазе на π/2 — как в пространстве, так и во времени. Кроме того, узлы и пучности скорости d dt частиц среды совпадают с узлами и пучностями их смещения ξ. Узлы же и пучности деформации ε совпадают соответственно с пучностями и узлами смещения. Это показано на рисунке для моментов t = 0 и t = Т/4, здесь узлы смещения отмечены жирными точками. В момент t = 0, когда ξ и ε становятся максимальными, скорость обращается Рис.3.2.5. в нуль, и наоборот (t = T/4). Соответственно происходят превращения энергии стоячей волны: то полностью в потенциальную (упругую), то полностью в кинетическую (аналогичное происходит при колебаниях маятника). На рис. 3.2.6 показано распределение плотности энергии в моменты t = 0 и t = T/4. В процессе колебаний происходит перетекание энергии от каждого узла к соседним с ним Рис.3.2.6. пучностям и обратно. Средний же по времени поток энергии в любом сечении стоячей волны равен нулю. 10 Лекция 3.3. Электромагнитные волны. Волновое уравнение для электромагнитного поля. Уравнения Максвелла для векторов Е и Н можно переписать в виде системы для проекций этих векторов на оси декартовой системы координат H y E y E x H x E x E z E z E y H z ; 0 ; 0 ; 0 y z t z x t x y t E x E y E z (3.3.1) ; t y z 0 E y H y H x E H x H z H z H y E j x 0 x ; j y 0 ; j z 0 z ; y z t z x t x y t H x H y H z =0. x y z В нейтральной однородной непроводящей среде, где плотность зарядов и плотность тока проводимости равны нулю, уравнения Максвелла запишутся dB E d l dt dS , D dS 0, (3.3.2) B d S 0 . dD Hdl dt dS , Из уравнений Максвелла следует важный вывод о существовании принципиально нового физического явления: электромагнитное поле способно существовать самостоятельно – без электрических зарядов и токов. При этом изменение его состояния обязательно имеет волновой характер. Это подтверждается тем, что, проведя ряд преобразований суравнениями (3.3.2), можно получить урав2 2 2 2 Е Е E E 2 2 0 0 2 , нения (3.3.3) 2 х y z t 2H 2H 2H 2H 2 0 0 2 . x 2 y 2 z t Как видно, это волновые уравнения. Они неразрывно связаны друг с другом, так как они получены из (3.3.2), которые связывают вектора Е и Н . Они описывают волну векторов Е и Н , распространяющуюся с фазовой скоростью 1 . (3.3.4) V 0 0 В вакууме 1 и скорость электромагнитной волны (скорость света в ваку1 уме) . (3.3.5) с 0 0 Это одна из фундаментальных физических констант. Тогда скорость волны в c c V , среде (3.3.6) n 11 где n – показатель преломления среды, который определяет во сколько раз скорость электромагнитной волны в среде меньше, чем в вакууме. Свойства электромагнитных волн. Установим основные свойства электромагнитной волны на примере плоской волны, распространяющейся в свободном пространстве (отсутствуют заряды и токи). Е и 1. Направим ось х перпендикулярно волновым поверхностям. При этом Н , а значит и их проекции на оси y и z, не будут зависеть от координат y и z, т. е. соответствующие производные по y и z будут равны нулю. Поэтому уравнения (3.3.1) упрощаются (останутся только производные по x) и принимают вид: 0 0 Н х t , 0 E t , 0 x E z / x 0 H y t , H z / x 0 E y t , E y / x 0 H z t , H y / x 0 E z t , (3.3.7) H x / x 0. E x / x 0, Из условий Ex / x 0 и Е х t 0 следует, что Ex не зависит ни от x, ни от t, аналогично - для Hx. Это значит, что отличные от нуля Ex и Hx могут быть обусловлены лишь постоянными однородными полями, накладывающимися на поле волны. А для переменного поля плоской волны Ex = 0 и Hx = 0, т.е. векторы Е и Н перпендикулярны направлению распространения волны – оси x. Значит, электромагнитная волна является поперечной. 2. Кроме того, оказывается, векторы Е и Н в электромагнитной волне взаимно ортогональны. Чтобы убедиться в этом, объединим средние уравнения (3.3.7), содержащие, например, Ey и Hz, в пару: H z / x 0 E y t . E y / x 0 Н z t , (3.3.8) (можно было бы взять и другую пару, содержащую производные Ez и Hy). Из этих уравнений видно, что изменение во времени, скажем, магнитного поля, направленного вдоль оси z, порождает электрическое поле Ey вдоль оси y. Изменение во времени поля Ey в свою очередь порождает поле H и т. д. Ни поля z Ez, ни поля Hy при этом не возникает. А это и значит, что E H . 3. Е y и H z являются решениями уравнений 2 Ey х 2 2Ey 2 H z 2H z 0 0 ; 0 0 , t 2 х 2 t 2 (3.3.9) т.е. представляют собой гармонические функции E y E m cost kx 01 ; H z H m cost kx 02 . (3.3.10) Как видно из (3.3.9) частоты и волновые числа в этих выражениях одинаковы, отличаются лишь амплитуды и начальные фазы. Подставив эти решения в уравнения (3.3.8), получим kEm sin t kx 01 0 H m sin t kx 02 kH m sin t kx 02 0 E m sin t kx 01 12 (3.3.11) Чтобы эти уравнения удовлетворялись в любой момент времени в любой точке пространства, нужно, чтобы 01 02 . Таким образом колебания векторов Е и Н в бегущей волне совпадают по фазе. Это значит, что Ey и Hz одинаковы в каждый момент по знаку, одновременно обращаются в нуль и одновременно достигают максимума, что представлено на рис 3.3.1, который называется мгновенным снимком волны. 4. Найдем связь мгновенных значений Ε и Н. Рис.3.3.1. Поскольку 01 02 , соотношения (3.3.11) перепишутся (3.3.12) kEm 0 H m ; 0 Em kH m . Перемножив эти два равенства, получим 0 E m2 0 H m2 . (3.3.13) Это соотношение связывает амплитуды колебаний Е и Н. Но поскольку фазы их колебаний совпадают, то мгновенные значения подчиняются такому же равенству (3.3.14) 0 Е 2 0 Н 2 Энергия электромагнитной волны. Вектор Пойнтинга. С бегущей электромагнитной волной связан перенос энергии. Плотность потока энергии в этом случае можно найти как и для упругой волны через произведение плотности энергии w на скорость волны V (см.формулу (3.2.23)). В обычной изотропной среде с проницаемостями ε и μ плотность энергии электромагнитного поля равна сумме плотностей энергии электрического и магнитного полей: 0 E 2 0 H 2 w . 2 2 (3.3.15) В данной среде справедливо соотношение (3.3.14) между Ε и Н, а это означает, что плотность электрической составляющей в бегущей волне равна плотности магнитной. Поэтому (3.3.15) можно записать так: w 0 E 2 0 0 EH EH / V , (3.3.16) где V – скорость волны. Умножив w на V, получим модуль вектора плотности потока энергии: S wV EH . (3.3.17) Векторы Е и Н взаимно ортогональны и образуют с направлением распространения волны правовинтовую систему. Значит, направление вектора их векторного произведения ЕН совпадает с направлением переноса энергии, а модуль этого вектора равен ЕН. Поэтому вектор плотности потока электро магнитной энергии S можно представить как S EH . (3.3.18) Вектор плотности потока энергии электромагнитной волны S называют вектором Пойнтинга. 13 В случае бегущей гармонической электромагнитной волны (3.3.10) плотность энергии, согласно (3.3.16) и (3.3.14), равна w 0 E m2 cos 2 t kx. Плотность же потока энергии, как следует из (3.3.17), (3.3.19) S wV 0 / 0 Em2 cos2 t kx , где учтено, что скорость V определяется формулой (3.3.4). Интенсивность I такой волны равна, по определению, среднему значению модуля плотности потока энергии: I = <S>. Принимая во внимание, что при усреднении (3.3.19) среднее значение квадрата косинуса равно 1/2, получим (3.3.25) I 0 / 0 E m2 / 2. Домножив и поделив подкоренное выражение в этой формуле на 0 и учтя (3.3.5) и (3.3.6), получим 0 Em2 0 Em2 I c cn , 2 2 или для волны, распространяющейся не ферромагнитной среде ( мало отлича1 ется от единицы) (3.3.27) I 0 cnEm2 2 Обратим внимание, что I пропорционально квадрату амплитуды, I ~ Еm2 . Необходимо отметить также, что интенсивность электромагнитной волны выражают обычно через напряженность ее электрической составляющей, поскольку, как показывает опыт, физиологическое, фотохимическое, фотоэлектрическое и другие действия света обусловлены именно ею. Стоячая электромагнитная волна. Мы уже говорили, что стоячую упругую волну можно представить как результат суперпозиции двух одинаковых волн, бегущих навстречу друг другу. Это относится и к электромагнитным волнам. Однако надо учесть, что электромагнитная волна характеризуется не одним вектором, а двумя взаимно ортого нальными векторами Е и Н . Пусть волна распространяется в положительном направлении оси х и описывается уравнениями E y E m cost kx , (3.3.28) H z H m cost kx . Для волны, распространяющейся в обратном направлении, как мы знаем, в скобках минусы заменяются на плюсы. Кроме того, будем помнить, что векторы Е , Н , k должны составлять правую тройку. 14 Это поясняет рис.3.3.2, где в части (а) показаны возможные ориентации векторов Е и Н в волне, распространяющейся в прямом, а в части (б) – в обратном направлении. Рис.3.3.2. Таким образом, при сложении волн либо векторы Е , либо Н будут иметь противоположные направления, а, значит, при векторном сложении их модули будут вычитаться. Итак, уравнения встречной волны будут иметь вид: E y E m cos(t kx), (3.3.29) H z H m cos(t kx), H z H m cos t kx . или (3.3.30) Е y Em cost kx , В результате суперпозиции двух встречных волн, (3.3.28) и (3.3.29), получим: E y 2 E m cos kx cos t H z 2 H m sin kx sin t. (3.3.31) Это и есть уравнения стоячей электромагнитной волны. Видно, что в этой волне колебания векторов Е и Н сдвинуты по фазе на π/2 как в пространстве, так и во времени. Если в некоторый момент Ey во всех точках имело максимальное значение и при этом Hz = 0, то через четверть периода картина будет обратной: Hz достигнет всюду максимальных значений со сдвигом в пространстве на λ/4, а Ey обратится в нуль. Таким образом, в процессе колебаний электрическое поле постепенно переходит в магнитное, магнитное — в электрическое Рис.3.3.3. и т. д. (см. рис.3.3.3). Поскольку колебания векторов Е и Н происходят не в фазе, соотношение (3.3.13) оказывается справедливым только для амплитудных значений Εm и Ηm стоячей волны: 0 E m 0 H m . (3.3.32) В стоячей электромагнитной волне энергия переходит из чисто электрической, имеющей максимумы в пучностях Е , в магнитную с максимумами в пучностях вектора Н , т. е. смещенным в пространстве на λ/4. Таким образом, происходит преобразование энергии электрического поля в энергию мгнитного и наоборот на расстоянии четверти длины волны. Это аналогично поведению гармонического осциллятора, например математического маятника, где энергия переходит из чисто потенциальной (в крайнем положении) в кинетическую (в положении равновесия), и наоборот. Макроскопического переноса энергии не происходит. Отсюда и название волны – стоячая. Электромагнитная волна на границе раздела диэлектриков Выясним, что происходит при падении плоской электромагнитной волны на границу раздела двух однородных изотропных прозрачных диэлектриков, маг15 нитная проницаемость которых равна единице (µ = 1). Известно, что при этом возникают отраженная и преломленная волны. Ограничимся рассмотрением частного, но практически важного случая, когда волна падает нормально на границу раздела диэлектриков с показателями преломления n1 и n2. Обозначим электрическую составляющую в падающей, отраженной и пре ломленной волнах соответственно через Е , Е ! и Е !! , а магнитную составляющую — через Н , Н ! и Н !! . Из соображений симметрии ясно, что колебания векторов Е , Е ! и Е !! происходят в одной плоско сти. Это же относится и к векторам Н , Н ! и Н !! . На рисунке показаны относительное расположение этих векторов в непосредственной близости от границы раздела и направления распространения всех трех волн, обозначенные вектора ми k , k ! и k !! . Дальнейший расчет покажет, насколько эта картина соответствует действительности. Воспользуемся граничными условиямидля тангенциальных составляющих векторов Е и Н : Рис.3.3.4. E1 y E2 y , (3.3.33) H1z H 2 z . Перепишем эти условия для нашего случая: E y E y' E y'' (3.3.34) H z H z' H z'' . (3.3.35) Согласно (3.3.14), H z 0 0 E y 0 с Е y 0 cn1 E y , Тогда H z!! 0 сn2 E !y! , но H z' 0 сn1 E y' , поскольку проекции E’y и Н’z, в отраженной волне имеют противоположные знаки (см. рис.3.3.4). Поэтому равенство (3.3.35) можно переписать так: n1E y n1E y' n2 E y'' , или E y E y' n2 / n1 E y'' . (3.3.36) Решив совместно уравнения (3.3.34) и (3.3.36), получим выражения для Е’y и Е”y через Еy, которые в векторной форме имеют вид: n n2 Е! 1 Е, n1 n2 Е !! 2n1 Е. n1 n2 (3.3.37) Отсюда следует, что: 1. Вектор Е !! всегда сонаправлен с вектором Е , т. е. оба вектора колеблются синфазно — при прохождении волны через границу раздела фаза не претерпевает скачка. 2. Это же относится и к векторам Е ! и Е , но при условии, что n1 > n2, т. е. если волна переходит в оптически менее плотную среду. В случае же, когда ! n1 < n2, дробь в выражении (3.3.37) для Е оказывается отрицательной, а это означает, что направление вектора Е ! противоположно направлению вектора Е , т. е. колебания этих векторов происходят в противофазе (этому соответствует рис.3.3.4). Другими словами, при отражении волны от оптически более плот ной среды фаза колебаний вектора Е изменяется скачком на π. 16 Эти результаты мы будем использовать в дальнейшем при изучении интерференции волн, отраженных от поверхностей тонких пластинок. Коэффициенты отражения и пропускания. Вопрос об этих коэффициентах мы рассмотрим для случая нормального падения световой волны на границу раздела двух прозрачных диэлектриков. Ранее мы выяснили, что интенсивность I гармонической волны, пропорциональна Em2 . Коэффициент отражения, по определению, есть I / I n1Em2 / n1Em2 . После подстановки отношения Е’m /Еm из первой формулы (3.3.37), найдем: 2 I n n 1 2 . I n1 n2 (3.3.38) I 4n1n2 . I n1 n2 2 (3.3.39) Обратим внимание на то, что не зависит от направления падающей волны на границу раздела: из среды 1 в среду 2, или наоборот. При небольшой разнице показателей преломления граничащих сред этот коэффициент оказывается очень небольшим (на границе стекло – воздух он составляет 0,04) Аналогично находим и коэффициент пропускания как отношение I’’/I. Согласно (3.3.27), I”/I = n2 Em2 / n1Em2 . Остается учесть вторую формулу из (3.3.37), и мы получим, что коэффициент пропускания Нетрудно убедиться в том, что сумма обоих коэффициентов + = 1, как и должно быть. Лекция 3.4 Поляризация волн. Поляризация света. Способы поляризации. Как уже указывалось, электромагнитная волна является поперечной. Это зна чит, что векторы Е и Н всегда лежат в плоскости перпендикулярной направлению распространения волны (лучу). Однако, как именно в этой плоскости расположены эти векторы, зависит от источника волны. (В дальнейшем будем вести речь о световом векторе Е ) В зависимости от длины волны (или частоты) различают несколько видов электромагнитных волн: радиоволны, оптический диапазон, рентгеновское и гамма-излучения. В дальнейшем нас будет интересовать главным образом оптический диапазон длин волн. Его подразделяют на инфракрасное излучение ……….. ~ 1 мм ÷ 0,76 мкм, видимое излучение (свет) ………. ~ 0,76 ÷ 0,40 мкм, ультрафиолетовое излучение...... . ~ 0,40 ÷ 0,01 мкм. Соответствующие длины волн указаны в вакууме. По классическим представлениям излучение светящегося тела (газа) слагается из волн, испускаемых его атомами. Излучение отдельного атома продолжается порядка 10-8 c и представляет собой, как говорят, цуг волн. Излучив, атом 17 через некоторое время, придя в возбужденное состояние, излучает опять и т. д. Одновременно излучает множество атомов. Порожденные ими цуги волн, налагаясь друг на друга, образуют испускаемую телом световую волну. Направления колебаний для каждого цуга ориентированы случайным образом. Поэтому в результирующей световой волне колебания светового вектора происходят в разных направлениях с равной вероятностью, оставаясь в плоскости перпендикулярной лучу. Это надо понимать так, что при прохождении световой волны через некоторую точку колебания светового вектора быстро и беспорядочно сменяют друг друга. Такой свет называют неполяризованным или естественным. Существуют способы упорядочивания колебаний световой волны. Свет, в котором направление колебаний светового вектора упорядочено каким-либо образом, называют поляризованным. Если колебания светового вектора происходят Е свет называют плоскотолько в одной плоскости, содержащей луч и вектор (или линейно-) поляризованным (конец вектора Е описывает прямую линию в плоскости перпендикулярной лучу. В этом случае вектор Е меняется только по величине, не меняя направления. Плоскость, в которой происходят колебания светового вектора, называют плоскостью поляризации волны. Если конец светового вектора описывает в этой плоскости эллипс, то такой свет называют эллиптически-поляризованным. Частным случаем такой поляризации является круговая или циркулярная, когда световой вектор меняется только по направлению, не меняясь по модулю. В зависимости от направления вращения вектора Е различают правую и левую эллиптические (или круговые) поляризации. Если смотреть навстречу распространения волны, и вектор Е при этом поворачивается по часовой стрелке, то поляризацию называют правой, в противном случае (если против часовой стрелки) — левой. Создание принципиально нового источника света — лазера позволило получить плоско-поляризованный свет с высокой степенью монохроматичности. Использование такого источника света сильно упростило экспериментальное решение многих вопросов, связанных с интерференцией, дифракцией и др. Способы поляризации света. 1. Поляризация при отражении света на границе раздела диэлектриков. Естественный свет можно представить как наложение (сумму) двух некогерентных (несогласованных) плоскополяризованных волн с взаимно ортогональными плоскостями поляризации. Рассматривая отражение и преломление волны, падающей под произвольным углом на границу раздела диэлектриков, можно найти соотношения между амплитудами и фазами падающей, отраженной и преломленной волн – так называемые формулы Френеля. При необходимости с ними можно познакомиться во многих учебниках и справочниках. Мы не будем выписывать эти формулы, поскольку для решения наших вопросов они нам не понадобятся. Важно отметить только, что с помощью этих формул можно показать, что при произвольном угле падения (и соответству18 ющем ему угле преломления ) коэффициенты отражения линейнополяризованного света, плоскость поляризации которого перпендикулярна плоскости падения ( ) и параллельна ей ( ), определяются следующими выражениями: (3.4.1) Поскольку эти коэффициенты различны то отраженный и преломленный пучки оказываются частично-поляризованными. В отраженном свете преобла дают колебания вектора Е , перпендикулярные к плоскости падения, а в преломленном свете, параллельные плоскости падения. Степень поляризации обеих волн (отраженной и преломленной) зависит от угла падения. Рис.3.4.1. При некотором значении угла падения отраженный свет становится полностью поляризованным, и его плоскость поляризации (плоскость колебаний вектора Е ) оказывается перпендикулярной к плоскости падения. Такое явление наблюдается, когда = /2, т.е. отраженный и преломленный лучи ортогональны, и значит, tg(/2)=∞ .Тогда коэффициент отражения = 0, т. е. отраженный свет будет полностью линейнополяризованным в плоскости, перпендикулярной плоскости падения. Угол падения, при котором наблюдается такой эффект называется углом Брюстера или углом полной поляризации. Этот угол БР удовлетворяет следующему условию: tgБР n2 / n1. (3.4.2) На рис.3.4.1. представлена именно такая ситуация. Точками и черточками на отраженном и преломленном лучах этого рисунка показаны направления коле баний вектора Е . 2. Поляризация при двойном лучепреломлении. Почти все прозрачные кристаллические диэлектрики оптически анизотропны, т. е. оптические свойства света при прохождении через них зависят от направления. Вследствие этого возникает явление, называемое двойным лучепреломлением. Оно заключается в том, что падающий на кристалл пучок света разделяется внутри кристалла на два пучка, распространяющиеся, вообще говоря, с разными скоростями. Существуют кристаллы одноосные и двуосные. У одноосных кристаллов один из преломленных пучков подчиняется обычному закону преломления ( ). Его называют обыкновенным и обозначают буквой или индексом о. Другой пучок необыкновенный (e), он не подчиняется обычному закону преломления, и даже при нормальном падении светового Рис3.4.2. пучка на поверхность кристалла необыкновенный пучок может 19 отклоняться от нормали (рис.3.4.2). И, как правило, необыкновенный луч не лежит в плоскости падения. Наиболее сильно двойное лучепреломление выражено у таких одноосных кристаллов как кварц (кристаллический), исландский шпат и турмалин. Далее мы ограничимся рассмотрением только одноосных кристаллов. У одноосных кристаллов имеется направление – оптическая ось 00’ - , вдоль которого обыкновенная и необыкновенная волны распространяются, не разделяясь пространственно и с одинаковой скоростью (у двуосных кристаллов, например слюды, имеются два таких направления). Оптическая ось 00’ кристалла не является какой-то особой прямой линией. Она характеризует лишь избранное направление в кристалле и может быть проведена через произвольную точку кристалла. Любую плоскость, проходящую через оптическую ось, называют главным сечением или главной плоскостью кристалла. Обычно пользуются главным сечением (плоскостью), проходящим через световой луч в кристалле. Обыкновенная и необыкновенная волны (и лучи) линейно поляризованы. Колебания вектора Е в обыкновенной волне совершаются в направлении, перпендикулярном главному сечению кристалла для обыкновенного луча. Колебания же вектора Е в необыкновенной волне – в главном сечении кристалла обыкно венного луча. Направления колебаний вектора Е (т.е. их плоскости поляризации) в обоих пучках показаны на рис.3.4.2, где предполагается, что оба пучка и пересекающая их оптическая ось 00’ лежат в плоскости рисунка. Видно, что в данном случае плоскости поляризации обеих волн (о и е) взаимно ортогональны. Заметим, что это наблюдается практически при любой ориентации оптической оси, поскольку угол между обыкновенным и необыкновенным лучами достаточно мал. Оба луча, вышедшие из кристалла, отличаются друг от друга только направлением поляризации, так что названия «обыкновенный» (о) и «необыкновенный» (е) имеют смысл только внутри кристалла. Раздвоение световых лучей обусловлено зависимостью показателя преломления среды от направления светового вектора волны. Световую волну, падающую на кристалл, можно представить как совокупность двух линейно поляризованных волн, у одной из которых плоскость поляризации перпендикулярна главному сечению кристалла (обыкновенный луч), а у другой – параллельна ему (необыкновенный луч). Скорость распространения обыкновенной волны и, следовательно, показатель преломления для нее n 0 не зависят от направления распространения (т.е. эта волна ведет себя в кристалле как в изотропной среде). Скорость же распространения и показатель преломления необыкновенной волны n e зависят от направления распространения. Таким образом, законы преломления для необыкновенного луча изменяются, в частности, он может не лежать в плоскости падения. При распространении вдоль оптической оси оба показателя преломления совпадают, поэтому раздвоения луча не происходит. Наибольшее отличие n e от n 0 наблюдается при распространении в направлении перпендикулярном оптической оси. 20 Поляризаторы. Закон Малюса. Устройства, с помощью которых можно получить из естественного поляризованный свет (обычно линейно-поляризованный) называются поляризаторами. Действие таких приборов может быть основано на двух вышеназванных явлениях. В любом случае вышедший из поляризатора свет линейно поляризован, а плоскость, проведенная через вектор Е и вышедший луч, называется плоско стью поляризатора. Поляризатор пропускает лишь волну, колебания вектора Е в которой параллельны этой плоскости. Пусть на поляризатор падает плоско-поляризованная вол Плоскость на. Плоскость, проведенная через вектор Е и луч, называется поляризатора плоскостью поляризации. Пусть плоскость поляризации па дающей волны составляет с плоскостью поляризатора угол . Е " Е0 Такую волну можно представить как суперпозицию двух других, у одной из которых плоскость поляризации параллельна плоскости поляризатора, а у другой – перпендикулярна (рис.3.4.3). Поляризатор пропустит лишь первую из них. Из Е E" E0 cos . А поскольку интенсиврисунка видно, что Рис.3.4.3 ность волны пропорциональна квадрату амплитуды, то интенсивность вышедшей из поляризатора волны I связана с интенсивностью падающей I 0 (3.4.3) I I 0 cos2 . Соотношение (3.4.3) называется законом Малюса. Если падающий свет естественный, то угол хаотически меняется в пределах от 0 до 2 и при усреднении соотношения (3.4.3)получим интенсивность вышедшего луча 1 (3.4.4) I I ест . 2 Лекция 3.5 Фазовая и групповая скорости волны. Дисперсия. В вакууме все электромагнитные волны распространяются с одинаковой скоростью, называемой скоростью света - с. Скорость же распространения волн разных частот в веществе будет различной. Дело в том, что электрические диполи диэлектрика под влиянием электромагнитного поля волны совершают вынужденные колебания. Электромагнитное излучение, вызванное колебаниями этих диполей, создает вторичную волну, которая, накладывается на исходную (первичную) и дает результирующую волну в веществе. Это наложение оказывается достаточно сложным и в результате скорость волны оказывается зависящей от ее частоты. 21 Строго монохроматическая волна представляет собой бесконечную во времени и пространстве последовательность «горбов» и «впадин», перемещающихся вдоль оси х с фазовой скоростью (3.5.1) V . k С помощью такой волны нельзя передать никакого сигнала, так как каждый последующий «горб» или «впадина» ничем не отличаются от предыдущего. Рис.3.5.1. Однако, как уже отмечалось, монохроматическая волна это идеализация. Реально любая волна представляет собой некую совокупность (суперпозицию) волн с частотами, заключенными в некотором интервале . Если этот интервал невелик, то такая совокупность называется волновым пакетом или группой волн. С помощью такой системы можно передавать сигнал (рис.3.5.1) Рассмотрим простейший случай. Пусть волновой пакет состоит из двух волн с одинаковыми амплитудами и небольшим отличием по частотам (а следовательно и по волновым числам) Е1 E m сost kx, E 2 E m cos t k k х. , (3.5.2) где « и k «k. Тогда, сложив эти две волны, получим k (3.5.3) Е Е1 Е2 2 Ет cos t х cost kx . 2 2 Выражение, стоящее в квадратных скобках, можно считать амплитудой волнового пакета (огибающая на рис.3.5.1). Эта амплитуда меняется в пространстве и во времени, но фиксировав некоторое ее значение, например максимум (точка В на рисунке) можно передавать информацию. Найдем скорость этой точки. Для этого фиксируем некоторое значение амплитуды. За время dt это значение переместится на dx . Тогда можно записать k t dt k х dx, t х 2 2 2 2 Откуда получим dx . (3.5.4) dt k Эта величина есть не что иное, как скорость перемещения амплитуды волнового пакета, называемая групповой скоростью. Это также скорость перемещения энергии. Мы получили это выражение для группы, состоящей из двух волн. В общем случае для групповой скорости, которую обозначим u, имеет место выражение 22 u d . dk (3.5.5) . (3.5.6) k Найдем связь между групповой и фазовой скоростью. Учтем связь между длиной волны и волновым числом k 2 . Тогда получим d Vk dV dV . (3.5.7) u V V dk dk d Из полученного соотношения следует, что, если фазовая скорость не зависит от частоты (или длины волны), то групповая и фазовая скорости одинаковы и форма волнового пакета не меняется. Если же фазовые скорости для разных составляющих пакета различны, то V ≠ u и форма волнового пакета меняется (пакет расплывается). Явление зависимости фазовой скорости (а, следовательно, и показателя преломления вещества) от длины волны (или частоты) называется дисперсией. V Напомним, что фазовая скорость волны Дисперсия света. Дисперсия света объясняется зависимостью диэлектрической проницаемости , а, следовательно, и показателя преломления от частоты (или длины волны ). Эта зависимость связана с взаимодействием электромагнитного поля световой волны с атомами и молекулами, показатель преломления при этом становится комплексной величиной, содержащей действительную часть – истинный показатель преломления п и мнимую часть – коэффициент поглощения .אּВ видимой и ультрафиолетовой областях спектра основное значение имеют колебания электронов, а в инфракрасной колебания ионов. Согласно классическим представлениям, под действием электрического поля световой волны электроны атомов или молекул совершают вынужденные колебания с частотой, равной частоте приходящей волны . При приближении частоты световой волны к частоте собственных колебаний электронов 0 возникает явление резонанса, обусловливающее поглощение света. Эта теория хорошо объясняет связь дисперсии света с полосами поглощения 23 Рис.3.5.2. На рис 3.5.2. показана зависимость показателя преломления и коэффициента поглощения от отношения частоты волны к собственной частоте электронов. Видно, что в области, где 1 , характер зависимости показателя преломле0 ния от частоты волны резко меняется и резко увеличивается коэффициент затухания. Область, где п растет с увеличением частоты, называется нормальной дисперсией, а , если п убывает с ростом частоты – аномальной дисперсией. Из графика видно, что аномальная дисперсия наблюдается при частотах, которые соответствуют сильному поглощению. Один из самых наглядных примеров дисперсии — разложение белого света при прохождении его через призму (опыт Ньютона). Рассмотрим дисперсию света в призме. Пусть монохроматический пучок света падает на призму с преломляющим углом А и показателем преломления n (рис.3.5.3) под углом . Рис.3.5.4. Рис.3.5.3 После двукратного преломления (на левой и правой гранях призмы) луч оказывается преломлен от первоначального направления на угол φ. Очевидно, что угол отклонения лучей призмой зависит от показателя преломления n, а n – функция длины волны, поэтому лучи разных длин волн после прохождения призмы отклоняются на разные углы (рис.3.5.4). Пучок белого света за призмой разлагается в спектр, что и наблюдал Ньютон. Таким образом, с помощью приз24 мы, разлагая свет на монохроматические составляющие, можно определить его спектральный состав. Лекция 3.6 Интерференция. Условия максимума и минимума интерференции. Интерференция - это явление наложения двух или нескольких волн, при котором результирующая интенсивность не равна сумме интенсивностей складываемых волн. Интерферировать могут волны любой физической природы. Мы рассмотрим это явление на примере электромагнитных волн. Пусть в некоторую точку пространства приходят две плоские электромагнитные волны Е1 = Е10 cos( 1 t─ k1 r + 1 ), (3.6.1) E2 E20 cos ( 2 t─ k 2 r + 2 ). Они возбуждают в этой точке колебания напряженности электрического поля E1 = E10 cos( 1 t + 10 ), E 2 = E20 cos( 2 t + 20 ), (3.6.2) где 10 и 20 - соответствующие начальные фазы. Результирующая напряженность, в соответствии с принципом суперпозиции, Е = Е1 + Е 2 . Интенсивность волны пропорциональна среднему по времени квадрату напряженности электрического поля: I ~ < Е 2 > = < ( Е1 + Е 2 ) 2 > = < Е12 > + < Е 22 > + 2 < ( Е1 · Е 2 )> (3.6.3) Здесь усреднение проводится за время наблюдения. Фактически всякий прибор, с помощью которого наблюдают интерференционную картину, обладает некоторой инерционностью, т.е. регистрирует не мгновенную картину, а усредненную за промежуток времени t, необходимый для «срабатывания» прибора. Это и есть время усреднения в (3.6.3). Первые два слагаемых в правой части (3.6.3) определяют (с учетом коэффициента пропорциональности) интенсивности волн I 1 и I 2 . Интерференция будет наблюдаться, если третье слагаемое будет отличаться от нуля. Для этого векто ра Е 1 и Е 2 не должны быть взаимно перпендикулярны. В дальнейшем будем полагать, что Е1 и Е 2 параллельны. Рассмотрим идеализированный случай монохроматических плоских волн, т.е. амплитуды, частоты и волновые векторы ( k ) будем полагать константами, причем | k 1 | = | k 2 | = k. 1 = 2 = , Однако параллельность векторов Е1 и Е 2 еще не гарантирует отличие от нуля последнего слагаемого в (3.6.3). Для выполнения этого условия необходимо, чтобы модуль амплитуды результирующего колебания в данной точке не 25 менялся за время наблюдения. Это возможно лишь в случае, если разность фаз складываемых в этой точке колебаний ( = 1 — 2 ) не зависит от времени. Рис.3.6.1. Условия максимума и минимума интерференции. Модуль амплитуды результирующего колебания Е 0 в случае параллельности складываемых колебаний можно определить с помощью векторной диаграммы (рис. 3.6.1) Е 02 = Е 102 + Е 220 + 2 Е 10 Е 20 cos ( 1 — 2 ) . (3.6.4) Тогда результирующая интенсивность I = I 1 + I 2 + 2 I1 I 2 <cos ( 1 — 2 ) >. (3.6.5) В реальных источниках излучателями являются отдельные атомы, не связанные друг с другом ( 1 и 2 меняются независимо). Поэтому разность фаз ( 1 — 2 ) непрерывно изменяется, принимая с равной вероятностью любые значения, так что среднее по времени значение <cos( 1 ─ 2 )> равно нулю. Тогда суммарная интенсивность равна сумме интенсивностей складываемых волн – интерференция отсутствует. Если же добиться, чтобы разность фаз в каждой точке пространства оставалась неизменной с течением времени, то значение интенсивности в разных точках пространства будет отличным от суммы интенсивностей складываемых волн и различным в разных точках в зависимости от величины cos ( 1 — 2 ). В частности, при cos ( 1 — 2 ) = 1 интенсивность будет принимать максимальное значение: 2 I max =I 1 +I 2 +2 I1 I 2 = I1 I 2 . (3.6.6) Как нетрудно видеть, такая интенсивность будет осуществляться при (3.6.7) = 1 — 2 =2m , где целое число m = 0, 1, 2, …называется порядком максимума интерференции. Если cos ( 1 — 2 ) = —1, интенсивность будет минимальна: I min I1 I 2 2 I1 I 2 2 I1 I 2 . (3.6.8) Такая интенсивность наблюдается в точках, где (3.6.9) = 1 ─ 2 = ( 2m + 1) . Условия (3.6.7) и (3.6.9) называют условиями соответственно максимума и минимума интерференции. Волны, в которых вектора Е образуют угол не равный /2 и разность фаз колебаний в каждой точке не меняется с течением времени, называются когерентными. Интерференционную картину могут дать только такие волны. Фаза колебаний, возбуждаемых волной в некоторой точке пространства, зависит от расстояния, пройденного волной (x) и показателя преломления среды, в которой она распространяется (n).Фаза волны (для плоской волны) 26 2 x t nx t k 0 nx t nx . V c Величина s = nx называется оптическим ходом волны, а =(s 1 –s 2 )─ оптической разностью хода волн. Разность фаз колебаний в данной точке, которую будем в дальнейшем обозначать и оптическая разность хода волн связаны соотношением 2 (3.6.10) = , 2 где – длина волны в вакууме, = k 0 – волновое число в вакууме. Тогда условия возникновения максимумов и минимумов интенсивности можно записать: I = I max , если = m ; (3.6.11) I = I min , если = (2т+1) . (3.6.12) 2 Однако все вышеизложенное справедливо лишь для монохроматических волн. При наложении волн от двух реальных источников или даже от разных участков одного и того же протяженного источника интерференция не наблюдается. Следовательно, независимые источники некогерентны. Причиной этого является сам механизм излучения света атомами источника. Атом, получивший избыточную энергию (перешедший в возбужденное состояние), затем в течение очень короткого промежутка времени ( ≈10 8 с) излучает электромагнитную волну (цуг) и возвращается в нормальное (невозбужденное) состояние. Спустя некоторое время атом может вновь возбудиться и вновь излучить короткий импульс (цуг волны), причем заметим, что атомы излучают независимо друг от друга со случайными начальными фазами, беспорядочно изменяющимися от одного акта излучения к другому. Поэтому спонтанно излучающие атомы представляют собой некогерентные источники. Для получения когерентных волн применяют метод разделения волны от одного источника на две или несколько систем волн, так чтобы в каждой из них было представлено излучение одних и тех же атомов источника. Такие волны в силу общности происхождения когерентны и могут создать интерференционную картину. Принципиально возможны два метода получения таких систем: метод деления волнового фронта (опыт Юнга, бипризма Френеля и т.д. ) и метод деления амплитуды или деление по ходу волны ( интерференция в тонких пленках). При этом чтобы новые волны были когерентны при делении волнового фронта, необходимо соблюдение некоторых условий, о которых речь пойдет далее. Образовавшиеся после разделения вóлны во всех интерференционных схемах можно представить как бы исходящими из двух точечных источников S1 и S2 (действительных Рис.3.6.2. t kx t 27 или мнимых — это не существенно). Поэтому общий подход к интерпретации получаемых результатов будет единым, с него мы и начнем. Рассмотрим две волны, исходящие из когерентных источников S1 и S2 (рис.3.6.2). Пусть волны распространяются в вакууме. В области, где эти волны перекрываются — ее называют зоной интерференции — должна возникать система чередующихся максимумов и минимумов освещенности, которую можно наблюдать на экране Э. Разность расстояний r2 и r1 от источников до интересующей нас точки P = r2 - r1 представляет собой разность хода волн. В точках на экране, где выполняется условие (3.6.11), наблюдается максимум интенсивности, а в точках, где выполняется (3.6.12) – минимум. В случае, когда волны от источников распространяются не в вакууме, а в среде с показателем преломления n под следует понимать не геометрическую, а оптическую разность хода интерферирующих волн: = n(r2 - r1). При этом — это по-прежнему длина волны в вакууме. Найдем координаты точек на экране, где наблюдаются интерференционные максимумы и минимумы. В практически важных случаях расстояние от источников до экрана l много больше расстояния между ними d (угол θ мал) (см. рис.3.6.2)) и разность хода можно записать как =d∙sin =d·θ. А так как θ x/l, то для максимумов, согласно (3.6.11), получим d·x тах /l = m, откуда xтах ml / d . координата максимума (3.6.13) В точке x = 0 расположен максимум, соответствующий нулевой разности хода. Для него порядок интерференции m = 0. Это центр интерференционной картины. При переходе к соседнему максимуму m меняется на единицу и x — на величину x, которую называют шириной интерференционной полосы. Таким образом, x / , x l / d или (3.6.14) где угол, под которым видны оба источника из центра экрана, = d/l (см. рис.3.6.2). Проведя аналогичные выкладки, найдем координату минимума (2m 1) l . (3.6.15) xmin 2 d Ширину интерференционной полосы можно найти и как расстояние между соседними минимумами. Соответствующий расчет даст также соотношение (3.6.14) Из этих формул видно, что для увеличения ширины полосы следует увеличивать l, или уменьшать d, или то и другое, т. е. в конечном счете — уменьшать угловое расстояние между источниками. Полезно иметь в виду, что размер интерференционной картины обычно не превышает 1 мм, это при расстоянии от источников до экрана порядка нескольких десятков сантиметров. Практически для получения более яркой интерференционной картины в качестве источников S1 и S2 используют две щели (или изображения исходного источника – щели S), и интерференционная картина имеет вид чередующихся светлых и темных полос, параллельных данным щелям. 28 Найдем распределение интенсивности на экране. Рассмотрим идеализированный случай, когда источники S1 и S2 строго монохроматические. В интересующую нас точку экрана колебания от этих источников будут приходить практически с одинаковой амплитудой, A1 = A2 = A0. Тогда, согласно (3.6.4), (3.6.16) A2 2 A02 2 A02 cos 2 A02 1 cos 4 A02 cos 2 / 2, где — разность фаз. /. В нашем случае = 2π d·x/l. Имея в виду, что интенсивность I пропорциональна квадрату амплитуды A2, получим (3.6.17) I I 0 cos 2 x, где = πd/l, I0 – интенсивность в максимумах (в минимумах I = 0). Полученное идеализированное распределение интенсивности I(x) несколько отличается, естественно, от реального, которому соответствует рисунок. Способы получения интерференционной картины. Как уже было сказано, существуют два способа разделения волны от одного источника на две части, чтобы потом они могли дать интерференционную картину. Рассмотрим примеры. 1.Разделение волны по фронту. Примером такого способа является классический опыт Юнга. Он был впервые осуществлен английским физиком Томасом Юнгом в 1807 году. В нем яркий пучок солнечного света освещал узкую щель S d (рис.3.6.3). Прошедший через щель свет вследствие дифракции образует расхо дящуюся волну, которая падает на две узкие щели S1 и S2. Эти щели действуют как вторичные когерентные источники, и Рис.3.6.3. исходящие из них дифрагированные волны, перекрываясь, дают на экране Э систему интерференционных полос. Проведя расчет как было показано выше, можно найти координаты максимумов и минимумов на экране и ширину интерференционных полос. Однако в опыте Юнга простая картина интерференции осложняется еще явлениями дифракции у краев Рис 3.6.4. каждого из отверстий. Несколько позднее французский физик Френель предложил метод получения когерентных волн, при котором интерференцию можно наблюдать в более простых, физически более чи29 стых условиях. Схема опыта приведена на рис.3.6.4. Здесь l и ll - два зеркала. Их отражающие поверхности составляют угол близкий к 180 0 . Перед зеркалами помещают точечный источник света S. Построив изображения точки S в зеркалах, получаем мнимые источники S 1 и S 2 . Пучки света от этих изображений, пересекаясь под малым углом S 1 MS 2 дают интерференционную картину на экране АВ. Существует и ряд других способов разделения волны по волновому фронту: бипризма Френеля, зеркало Ллойда и т.д. 2.Разделение волны по амплитуде (по ходу волны). Примером такого способа является интерференция в тонких пленках. Пусть на прозрачную плоскопараллельную пластинку падает плоская монохроматическая световая волна, направление распространения которой показано падающим лучом на рис.3.6.5. В результате отражений от обеих поверхностей пластинки исходная волна расщепится на две, что и показано лучами 1 и 2. Амплитуды этих волн мало отличаются друг от друга — это важно для получения достаточно контрастной интерференции. Заметим, что, кроме этих двух отраженных волн (1 и 2), возникает еще многократное отражение. Однако их вклад практически пренебрежимо мал, и мы ограничимся только волнами, возникшими при однократном отражении. Оптическую разность хода волн 1 и 2 Рис.3.6.5. определим, согласно рисунку, как (3.6.18) n AB BC AD, где n — показатель преломления вещества пластинки. Кроме того, видно, что AB = BC = 2b/соs и AD = 2btg ·sin , b — толщина пластинки. В результате подстановки этих выражений в (3.6.18) получим (3.6.19) 2nb cos. Следует также учесть, что при отражении от верхней поверхности пластинки, от среды, оптически более плотной (вокруг пластинки находится воздух, показатель преломления которого можно полагать равным единице), в соответствии с (3.3.7) происходит скачок фазы на π у отраженной волны, т. е., как говорят, “потеря” полуволны ( / 2 ). Учитывая еще, что по закону преломления sin = n·sin , получим 2b n 2 sin 2 / 2 (3.6.20) (здесь можно было написать и / 2 , но это не существенно). Если отраженные волны 1 и 2 когерентны между собой, то максимумы отражения будут наблюдаться при условии 2b n 2 sin 2 / 2 m , (3.6.21) где m — целое число (порядок интерференции), а минимумы при условии (3.6.22) 2b n 2 sin 2 2 2m 1 2 30 Меняя угол падения , мы будем наблюдать последовательную смену максимумов и минимумов отражения. (Заметим, что при минимуме отражения наблюдается максимум проходящего через пластинку света, и наоборот.) Итак, мы выяснили, что при падении плоской световой волны на плоскопараллельную тонкую пластинку интенсивность отраженного света зависит от угла падения. Изменяя этот угол, мы будем наблюдать чередование максимумов и минимумов отраженного света. Это можно использовать для получения интерференционной картины в виде привычной системы полос. Достаточно использовать в качестве падающего рассеянный монохроматический свет (он содержит волны, падающие на Рис.3.6.6. пластинку одновременно под разными углами), а на пути отраженного света поставить линзу и в ее фокальной плоскости экран (рис.3.6.6). Максимумы на экране будут располагаться в местах, соответствующих условию (3.6.21). Полоса данного порядка интерференции обусловлена светом, падающим на пластинку под одним и тем же углом , но с разных направлений. Поэтому такие полосы называют полосами равного наклона. При расположении линзы как показано на рис.3.6.6, эти полосы имеют вид концентрических колец с центром в ее фокусе F. Порядок интерференции m растет с уменьшением угла падения , и в центре картины он максимален. В белом свете интерференционные полосы окрашены, поскольку условия максимума для разных длин волн соответствуют разным углам падения света. Поэтому такое явление называют цвета тонких пластинок. Пусть теперь стеклянная пластинка имеет форму клина с углом раствора , и на нее падает плоская монохроматическая световая волна. Теперь отраженные от поверхностей клина световые волны будут распространяться не в одном направлении, а под некоторым углом (рис.3.6.7) Рис.3.6.7. Так как разность хода лучей, отразившихся от различных участков клина, неодинакова из-за различия толщины пластинки в разных местах, в области локализации интерференции появятся светлые и темные полосы, параллельные ребру клина. Каждая из таких полос возникает в результате отражений от участков клина с одинаковой толщиной, поэтому их называют полосами равной толщины. Частным случаем полс равной толщины являются кольца Ньютона. Кольца Ньютона — это кольцевые полосы равной толщины, наблюдаемые при отражении света от поверхностей зазора между стеклянной пластинкой и соприкасающейся с ней выпуклой линзой (рис.3.6.8). Волна, отраженная от верхней поверхности линзы, в силу небольшой длины когерентности обычных источников света, некогерентна с волнами, отраженными от поверхностей зазора, и участия в образовании Рис.3.6.8. 31 интерференционной картины не принимает. Поэтому мы ее и не будем учитывать. При нормальном падении света кольца в отраженном свете имеют вид концентрических окружностей с центром в точке соприкосновения линзы с пластинкой. Найдем радиусы r темных колец (минимумов). Сначала запишем условие образования темных колец. Они возникают там, где оптическая разность хода волн , отраженных от обеих поверхностей зазора, равна нечетному числу полуволн: 2b / 2 2m 1 / 2, где /2 связано с “потерей” полуволны при отражении от пластинки и m = 0, 1, 2, ... . Отсюда (3.6.23) 2b m. 2 2 2 Далее, согласно теореме Пифагора r = R - (R - b) . Учитывая, что b << R, получим (3.6.24) r 2 2bR. Из (3.6.23) и (3.6.24) следует, что радиус m-го темного кольца m=0, 1, 2 … (3.6.25) rm mR , Заметим, что значению m = 0 соответствует минимум темного пятна (не кольца). Аналогичный расчет можно провести и для светлых колец. Если линзу постепенно отодвигать от поверхности пластинки, то интерференционные кольца будут стягиваться к центру: это ведь кольца (полосы) равной толщины, а она при этом перемещается к центру. С помощью колец Ньютона можно с достаточно высокой точностью контролировать качество изготовления, например, сферических поверхностей. Просветление оптики. В ее основе лежит интерференция света при отражении от тонких пластинок, дело в том, что при прохождении света через каждую преломляющую поверхность линзы отражается примерно 4% падающего света. В сложных объективах такие отражения совершаются многократно, и суммарная потеря светового потока оказывается весьма ощутимой. Например, в призменном бинокле она оставляет свыше 50%. В просветленной оптике на каждую поверхность линзы наносят путем напыления тонкую пленку прозрачного диэлектрика с показателем преломления n n1n2 , где n1 и n2 — показатели преломления сред, между которыми находится пленка. При этом условии амплитуды отраженных от обеих поверхностей пленки волн оказываются, согласно (3.3.37), практически одинаковыми. Толщина же пленки делается такой, чтобы волны, отраженные от обеих поверхностей пленки, оказывались в противофазе, т. е. гасили друг друга. Обычно просветление оптики проводят для средней (желто-зеленой) области видимого спектра. Для краев же этого спектра коэффициент отражения заметно отличается от нуля, и объективы кажутся в отраженном свете пурпурными, что соответствует смешению красного и фиолетового цветов. 32 Лекция 3.7 Понятие когерентности. Временная и пространственная когерентность. Как уже отмечалось интерференционную картину можно наблюдать лишь при наложении когерентных волн. Обратим внимание на то, что в определении когерентных волн отмечено не существование, а наблюдение интерференции. Это означает, что наличие или отсутствие когерентности зависит не только от характеристики самих волн, но и от промежутка времени регистрации интенсивности. Одна и та же пара волн может быть когерентной при одном времени наблюдения и некогерентной при другом. Две световые волны, полученные из одной методом деления амплитуды или методом деления волнового фронта, не обязательно интерферируют друг с другом. В точке наблюдения складываются две волны с волновыми векторами k1 и k 2 . Есть две основные причины возможной некогерентности таких волн. Первая причина — немонохроматичность источника света (или непостоянство модулей волновых векторов). Монохроматичный свет — свет одной частоты. Строго монохроматичная волна в каждой точке пространства имеет не зависящую от времени амплитуду и начальную фазу. Как амплитуда так и фаза реальной световой волны испытывают некоторые случайные изменения во времени. Если изменения частоты невелики и изменения амплитуды достаточно медленные (их частота мала по сравнению с оптической частотой ), то говорят, что волна квазимонохроматическая. Вторая причина возможной некогерентности световых волн, полученных из одной волны — пространственная протяженность реального источника света (или непостоянство направления каждого из волновых векторов). В реальности имеют место обе причины одновременно. Однако для простоты разберем каждую причину отдельно. Временная когерентность. Пусть имеется точечный источник света S и S 1 и S 2 , являющиеся действительными или мнимыми его изображениями (рис.3.6.3 или 3.6.4). Допустим, что излучение источника состоит из двух близких и одинаково интенсивных волн с длинами волн и ' (очевидно то же будет справедливо и для источников S 1 и S 2 ). Пусть начальные фазы источников S 1 и S 2 одинаковы. В некоторую точку экрана лучи с длинами волн и ' придут в одинаковых фазах. Назовем эту точку центром интерференционной картины. Для обеих волн там получится светлая полоса. В другой точке экрана, где разность хода N' (N – целое число, номер полосы) для длины волны ' получится также светлая интерфе1 ренционная полоса. Если та же N , то в ту же точку экрана лучи с 2 длиной волны придут уже в противофазах, и для этой длины волны интерференционная полоса будет темной. При этом условии в рассматриваемой точке экрана светлая полоса наложится на темную – интерференционная картина 33 исчезнет. Таким образом, условие исчезновения полос есть 1 N N , откуда максимальный номер интерференционной полосы 2 . (3.7.1) mmax N 2 Перейдем теперь к случаю, когда свет от источника представляет собой совокупность волн с длинами, лежащими в интервале , . Разобьем этот спектральный интервал на совокупность пар бесконечно узких спектральных линий, длины волн которых отличаются на 2 . К каждой такой паре применима формула (3.7.1), где нужно заменить на 2 . Поэтому исчезновение интерференционной картины произойдет для порядка интерференции (3.7.2) mmax Эта формула дает оценку максимально возможного порядка интерференции. Величину называют обычно степенью монохроматичности волны. Таким образом, для наблюдения интерференционной картины при разбиении волны по ходу луча разность хода двух полученных волн не должна превышать величины mmax , которую называют длиной когерентности l ког 2 lког . ≤ mmax (3.7.3) Понятие длины когерентности можно пояснить следующим образом. Рассмотрим две точки на одном луче как два возможных вторичных источника света для наблюдения интерференционной картины. При этом расстояние от каждой из точек до мысленного экрана предполагается одинаковым (рис.3.7.1). Здесь и — две выбранные вдоль луча Рис.3.7.1. точки, в которые мысленно поместим полупрозрачные пластинки для получения интерференционной картины на экране . Пусть .Оптическая разность хода для интерферирующих лучей и , равна . Если превышает величину , то как указывалось выше интерференционная картина «смазывается», и, следовательно, вторичные источники света в точках и оказываются некогерентными. Расстояние между точками и , при котором это начинает происходить, называется длиной когерентности вдоль луча, длиной продольной когерентности или просто длина когерентности. 34 Расстояние, равное длине когерентности, волна проходит за время когерентности ког lког 2 . с с (3.7.4) Временем когерентности можно назвать максимальный промежуток времени, при усреднении по которому еще наблюдается эффект интерференции. Опираясь на приведенные оценки, можно оценить толщину пленки, с помощью которой можно получить интерференционную картину (расшифровать термин «тонкая пленка», использованный в предыдущей лекции). Пленку можно назвать «тонкой», если разность хода волн, дающих интерференционную картину, не превышает длины когерентности световой волны. При падении волны на пленку под малым углом (в направлении близком к нормали) разность хода равна 2bn (формула (3.6.20)), где b – толщина, а n – показатель преломления материала пленки. Поэтому интерференционную картину можно получить 2 на пленке, для которой 2bn ≤ l ког = . (3.7.5) Заметим, что при падении волны под большими углами нужно еще учитывать возможную некогерентность разных точек волнового фронта. Оценим длину когерентности света, излучаемого разными источниками. 1.Рассмотрим свет, излучаемый естественным источником (не лазером). Если на пути света поставить стеклянный светофильтр, ширина полосы пропускания которого ~ 50нм, то для длины волны середины оптического спектрального интервала ~ 600нм получим, согласно (3.7.3), lког ~ 10 5 м. Если же светофильтр отсутствует, то длина когерентности будет примерно на порядок меньше. 2.Если источником света является лазер, то его излучение обладает высокой степенью монохроматичности ( ~ 0,01нм) и длина когерентности такого света для той же длины волны окажется порядка 4·10 2 м. Пространственная когерентность. Возможность наблюдать интерференцию когерентных волн от протяжённых источников приводит к понятию пространственной когерентности волн. Для простоты рассуждений представим, что источники когерентных электромагнитных волн с одинаковыми начальными фазами и с длиной волны расположены на отрезке длины b, находящемся на расстоянии l» b от экрана (рис.3.7.2), на котором наблюдается их интерференция. Наблюдаемая на экране интерференционная картина может быть представлена как наложение интерференционных картин, создаваемых бесконечным множеством пар точеч35 ных когерентных источников, на которые можно мысленно разбить протяжённый источник. Рис.3.7.2. Выделим среди всего множества источников источник, расположенный посредине отрезка, и сравним интерференционные картины двух пар, одна из которых образована центральным источником и некоторым произвольно выбранным близко расположенным к нему источником, а другая - центральным и источником, расположенным на одном из концов отрезка. Очевидно, что интерференционная картина пары близкорасположенных источников будет иметь близкое к максимальному значению в центре экрана в точке наблюдения (рис. 3.7.2) . В тоже время интерференционная картина другой пары будет иметь значение, зависящее от оптической разности хода электромагнитных волн, испускаемых источниками в центре отрезка и на его крае b b sin ≈ 0,25b , (3.7.6) 2 2 2 2 где - угловой размер источника (рис.3.7.2), который ввиду b « l достаточно мал, так, что справедливы очевидные преобразования, использованные при выводе формулы (3.7.6) . Отсюда следует, что волны от различных точек протяжённого источника, приходящие в точку наблюдения , расположенную в центре экрана, будут иметь по отношению к волне от центрального источника оптическую разность хода, изменяющуюся по линейному закону от нуля до максимального значения 0,25 b . При определённой длине источника приходящие в точку наблюдения волны могут иметь фазу, отличающуюся на 180о от фазы волны, излучаемой центральной точкой отрезка. В результате этого волны, приходящие в центр экрана от различных частей источника, будут уменьшать значение интенсивности по сравнением с максимальным, которое имело бы место, если бы все волны имели одинаковую фазу. Эти же рассуждения справедливы и по отношению к другим точкам экрана. Вследствие этого интенсивности в максимумах и минимумах интерференционной картины протяжённого источника будут иметь близкие значения и видность интерференционной картины будет стремиться к 36 2 в (3.7.6). Значение наименьшей длины отрезка (источника) bmin , соответствующее этому условию определяется из соотношения (в этом случае т=1): 2 . bmin В оптике и теории электромагнитных волн половина этого значения определяет т.н. радиус пространственной когерентности электромагнитных волн, излучаемых протяжённым источником: (3. . 7.7) нулю. В рассматриваемом случае это имеет место при 2т 1 Физический смысл понятия радиуса пространственной когерентности протяжённого источника состоит в представлении о возможности наблюдения интерференционной картины от протяжённого источника, если он размещается внутри круга радиуса . Из сказанного следует вывод, что пространственная когерентность электромагнитных волн определяется угловым размером их источника. Пространственная когерентность - это когерентность света в направлении, перпендикулярном лучу (поперек луча). Получается, что это когерентность разных точек поверхности равной фазы. Но на поверхности равной фазы разность фаз равна нулю. Однако для протяженных источников это не совсем так. Реальный источник света не точечный, поэтому поверхность равных фаз испытывает небольшие повороты, оставаясь в каждый момент времени перпендикулярной направлению на излучающий в данный момент точечный источник света, расположенный в пределах реального источника света. Повороты поверхности равной фазы вызваны тем, что свет в точку наблюдения приходит то от одной, то от другой точки источника. Тогда, если предположить, что на такой псевдоволновой поверхности расположены вторичные источники, волны от которых могут дать интерференционную картину, то можно дать определение радиуса когерентности другими словами. Вторичные источники на псевдоволновой поверхности, которые можно считать когерентными, располагаются внутри круга, радиус которого равен радиусу когерентности. Диаметр когерентности это максимальное расстояние между точками на псевдоволновой поверхности, которые можно считать когерентными. Возвратимся к опыту Юнга (лекция 3.6). Чтобы получить в этом опыте четкую интерференционную картину, необходимо, чтобы расстояние между двумя щелями S 1 и S 2 не превышало диаметр когерентности. С другой стороны, как видно из (3.7.7), радиус (а, следовательно, и диаметр) интерференции увеличивается с уменьшением углового размера источника. Поэтому d- расстояние между щелями S 1 и S 2 и b- размер источника S связаны обратной зависимостью b·d ≤ l. (3.7.8) 37 ЛЕКЦИЯ 3.8. Явление дифракции. Зоны дифракции. Дифракция Френеля. Под дифракцией понимают явления, наблюдаемые при распространении волн в среде с резкими неоднородностями (края экранов, отверстия и др.), что связано с отклонениями от их прямолинейного распространения. Это приводит, в частности для световых волн, к огибанию волнами препятствий и проникновению света в область геометрической тени. Отметим, что явление дифракции наблюдается для любых волн. Мы постоянно наблюдаем дифракцию звуковых волн, волн на поверхности воды, радиоволн. Для наблюдения же дифракции световых волн необходимы специальные условия, обусловленные малостью их длин волн . Наблюдение дифракции света проводят обычно по такой схеме. На пути световой волны помещают непрозрачную преграду, закрывающую часть световой волны. За преградой располагают экран, на котором при определенных условиях возникает дифракционная картина в виде той или иной системы полос и пятен — максимумов и минимумов освещенности. Исследование распределения интенсивности света на экране и будет являться основной нашей задачей. Вообще говоря, для описания дифракционных явлений не требуется вводить никаких новых принципов. В рамках электромагнитной теории света задача сводится к нахождению решения уравнений Максвелла при определенных граничных условиях. Однако решение такой задачи представляет большие математические трудности. Поэтому в большинстве случаев, представляющих практический интерес, вполне достаточным оказывается приближенный метод решения задачи о распределении интенсивности света, основанный на принципе Гюйгенса-Френеля. Именно этот принцип и основанные на нем простые и наглядные методы расчета мы и возьмем за основу дальнейшего изложения. Принцип Гюйгенса - Френеля. Первое объяснение дифракции света принадлежит Френелю (1818 г.). Он показал, что количественное описание дифракционных явлений возможно на основе построения Гюйгенса, если его дополнить принципом интерференции вторичных волн. Принцип Гюйгенса устанавливает способ построения фронта волны в момент времени t t по известному положению фронта в момент времени t. Согласно этому принципу каждая точка, до которой доходит волновой фронт, служит вторичным источником волн. Огибающая этих вторичных волн и дает положение волнового фронта в следующий момент времени. Френель дополнил этот принцип положением о когерентности вторичных источников. Тогда вторичные волны, придя в точку наблюдения, дадут интерференционную картину. Учет амплитуд и фаз вторичных волн позволит найти результирующую амплитуду. 38 Рассмотрим для примера экран Э с некоторым отверстием, через которое проходит свет от точечного монохроматического источника Р0 (рис.3.8.1). Задача состоит в определении напряженности Е в любой точке Р за экраном. В методе Френеля предполагается, что напряженность Е в точках отверстия такая же, как и при отсутствии экрана, и что в точках непосредственно Рис.3.8.1. за экраном Е = 0. Т. е. считается, что существенна только форма отверстия экрана, но не сам экран. Это предположение, как показал опыт, справедливо, когда размеры отверстия и его расстояния до источника и точки наблюдения Р значительно больше длины волны , т. е. когда отклонения от геометрической оптики довольно малы. Оно нарушается для отверстия, например, щели, ширина которой значительно меньше . Закроем мысленно отверстие в экране произвольной поверхностью S. Разобьем эту поверхность на элементарные участки dS. По предположению Френеля каждый из этих участков становится источником вторичной сферической волны. Амплитуда вторичной световой волны, достигающей точки наблюдения Р, должна быть пропорциональна амплитуде Е первичной волны, приходящей к элементу dS, а также площади самого элемента dS, и обратно пропорциональна расстоянию r от элемента dS до точки Р. Для определения результирующей амплитуды колебаний в точке Р, т. е. суммы элементарных амплитуд, необходимо еще учесть, что колебания от разных элементов dS достигают точки Р с разными фазами. Это приводит к появлению в выражении для результирующей амплитуды множителя cos(kr + ), где k = 2π/, а — дополнительная фаза, равная фазе первичной волны в элементе dS (для разных элементов она в общем случае не одинакова). Таким образом, результирующая амплитуда напряженности Е в точке Р может быть представлена как суперпозиция элементарных амплитуд с учетом их взаимных фазовых соотношений: Em K S a0 coskr dS , r (3.8.1) где интегрирование проводится по выбранной нами поверхности S. В интеграле (3.8.1) a0 величина, определяемая амплитудой световой волны в месте нахождения элемента dS; К( ) — некоторый коэффициент, зависящий от угла между первоначальным направлением световой волны в данной точке (волновым вектором k ) и направлением на точку Р. Естественно предположить, что коэффициент К монотонно убывает с ростом угла. Многие практически важные дифракционные задачи можно, как мы увидим далее, решить при весьма общих предположениях относительно К( ), не уточняя конкретного вида зависимости его от угла . В дальнейшем мы будем рассматривать ситуации, позволяющие в качестве поверхности S брать волновую поверхность падающей волны, что значительно 39 упрощает расчеты. В этом случае угол в коэффициенте К( ) представляет собой угол между нормалью n к элементу поверхности dS и направлением от dS к точке Р, а дополнительную фазу в (3.8.1) можно считать равной нулю ( = 0). Расчет, базирующийся на принципе Гюйгенса— Френеля можно представить в простой и наглядной форме с помощью векторной (фазовой) диаграммы (рис.3.8.2)Использование подобных диаграмм в дальнейшем позволит значительно упростить многие рассуждения Рис.3.8.2. и расчеты. На этой диаграмме результирующая амплитуда Е т представлена как векторная сумма амплитуд d Е колебаний в точке Р от различных элементов dS поверхности S с учетом их фаз. Разность фаз между различными векторами dE на диаграмме определяет угол между этими векторами. Полуволновые зоны. Зоны Френеля. Суммирование (интегрирование) амплитуд элементарных колебаний, приходящих в точку Р, вообще говоря, весьма сложно. Но в простейших случаях, обладающих определенной симметрией, интегрирование может быть заменено простым алгебраическим или графическим сложением (последнее особенно наглядно). Суммирование амплитуд колебаний, приходящих от различных элементов волновой поверхности S, Френель предложил делать с помощью разбиения поверхности S на зоны, конфигурация которых зависит от симметрии рассматриваемой задачи. Суть метода состоит в том, чтобы разбить волновую поверхность на участки (зоны), так чтобы расстояния до точки наблюдения от краев каждой зоны отличались на половину длины волны - . Конфи2 гурация самих зон зависит от симметрии задачи. Эти зоны называются полуволновыми зонами. Смысл такого разбиения в том, что в этом случае волны Рис.3.8.3. от вторичных источников приходят в точку наблюдения со сдвигом по фазе на и при интерференции гасят друг друга. Это, как мы убедимся в дальнейшем, существенно упрощает расчет. Частным случаем полуволновых зон являются зоны Френеля. В этом случае зоны представляют собой кольца, которые симметричны относительно линии Р0 Р , где Р0 - источник, а Р – точка наблюдения (рис.3.8.3). Эти зоны выбираем так, чтобы расстояния от краев каждой зоны до точки Р отличались друг от друга на половину длины волны. Рис.3.8.4. Найдем внешний радиус m-й зоны Френеля, rm. 40 С этой целью воспользуемся рисунком 3.8.4. Из него видно, что 2 2 2 2 2 rm a a ha b m b ha , 2 где а – радиус волновой поверхности, отрезок ВО равен ha . Раскрыв это выражение и учитывая, что при на очень больших т членами, которые входит 2 можно пренебречь, получим bm ab ; rm (3.8.2) hm m . 2a b a b Заметим, что если падающая нормально на данное отверстие волна плоская (а), то (3.8.4) rm mb. Используя формулу площади сферического сегмента, получим площадь т-ой ab зоны (3.8.5) S т , ab т. е. практически одинаковы для всех зон. Однако, амплитуды колебаний, приходящих в точку Р от вторичных источников этих зон, монотонно и слабо убывают из-за увеличения расстояния r до точки Р от каждой следующей зоны и роста угла между нормалью к элементам зоны и направлением на точку Р. Спираль Френеля. Рассмотрим графический метод сложения амплитуд. В этом простом и наглядном методе каждую полуволновую зону Френеля дополнительно мысленно разбивают на весьма узкие кольцевые зоны. Амплитуду колебаний, создаваемых вторичными источниками каждой из таких зон, изобразим вектором d А . Вследствие увеличения расстояния r и уменьшения коэффициента К амплитуда колебаний, создаваемых каждой следующей узкой кольцевой зоной, будет убывать по модулю и отставать по фазе от колебаний, создаваемых предыдущей зоной. Изобразив отставание по фазе поворотом каждого вектора d А против часовой стрелки на соответствующий угол, получим цепочку векторов, векторная сумма которых и есть результирующая амплитуда колебаний в точке Р. На рис.3.8.5a показан результат действия 1-й зоны Френеля. Здесь амплитуда колебаний dAN от узкого кольца, прилегающего к границе 1-й зоны Френеля, отстает по фазе на π от амплитуды колебаний, приходящих в точку Р из центра 1-й зоны — от точки Рис.3.8.5. О - поэтому соответствующие этим амплитудам векторы взаимно противоположны по направлению. Продолжая построение, получим векторную диаграмму для результирующей амплитуды колебаний в точке Р от действия первых двух зон Френеля 41 (рис.3.8.5б), затем от первых трех зон Френеля (рис.3.8.5в) и т. д. Цепочка по мере увеличения числа узких кольцевых зон будет “закручиваться” в спираль, и в результате амплитуда от действия всех зон (всей волновой поверхности) будет равна А (рис.3.8.6). Эту спираль называют спиралью Френеля. Квадрат этой величины Рис.3.8.6. характеризует интенсивность в точке Р, если волна распространяется в отсутствие всяких преград (полностью открытый волновой фронт). При построении векторной диаграммы мы получаем спираль (а не окружность), так как амплитуды, создаваемые отдельными зонами, как уже говорилось, монотонно слабо убывают. Дифракция Френеля от круглого отверстия и круглого диска. Используя разобранный метод, можно достаточно легко решить задачу о дифракции от простейших преград. 1.Дифракция от круглого отверстия. Пусть на пути сферической волны расположен непрозрачный экран с круглым отверстием радиуса r, расположенный так, чтобы перпендикуляр, опущенный из источника, попал в центр отверстия (рис.3.8.3). На продолжении этого перпендикуляра расположена точка наблюдения Р. Число зон m в отверстии мы можем изменять. Например, для увеличения числа зон надо или расширить отверстие, или приблизить экран к нему, или то и другое вместе. Как видно из рис.3.8.5, результирующая амплитуда, а значит и интенсивность, зависит от того, четное или нечетное число m зон Френеля умещается в отверстии — для точки наблюдения Р. Если число зон нечетное, в точке Р наблюдается максимум, если же число зон четное, то — минимум. Таким образом, амплитуда колебаний и интенсивность света в точке Р по мере увеличения радиуса отверстия в экране изменяется не монотонно. Пока открывается первая зона Френеля, амплитуда в точке Р увеличивается и достигает максимума при полностью открытой зоне. Но по мере открывания второй зоны Френеля амплитуда колебаний в точке Р убывает, и при полностью открытых двух первых зонах уменьшается почти до нуля. Затем амплитуда увеличивается снова и т. д. То же самое будет наблюдаться, если вместо увеличения отверстия приближать к нему точку наблюдения Р вдоль прямой Р0Р. Это легко понять из рисунка: при этом число открываемых зон Френеля в отверстии экрана Э будет увеличиваться. На первый взгляд эти результаты, предсказанные на основе принципа Гюйгенса-Френеля, выглядят парадоксальными. Однако они хорошо подтверждаются опытом. В то же время согласно геометрической оптике интенсивность света в точке Р не должна зависеть от радиуса отверстия. Итак, амплитуда колебаний в точке Р от полностью открытой волновой поверхности, согласно представлениям Френеля, равна А = А1/2, т. е. интенсивность (I А2) в четыре раза меньше, чем при наличии экрана с круглым отверстием, открывающем только 1-ю зону Френеля. 42 Особенно неожиданным в методе Френеля представляется тот удивительный вывод, что при отверстии в экране, открывающем для точки Р две зоны Френеля, интенсивность в этой точке падает практически до нуля, хотя световой поток через отверстие оказывается вдвое больше. Нужно однако заметить, что такое чередование ярких максимумов и почти нулевых минимумов будет наблюдаться лишь в случае, когда отверстие оставляет открытым лишь небольшое число зон Френеля. Если же число открытых зон очень велико, то, как видно из рис.3.8.6, разница в интенсивности при четном и нечетном числе зон становится очень маленькой. Практически в этом случае в точке Р всегда наблюдается максимум и интенсивность такова, как будто никакой преграды нет. Такая ситуация называется геометрической оптикой. Метод зон Френеля позволяет сравнительно просто найти интенсивность света только в точке Р, лежащей на оси круглого отверстия в экране. Расчет же распределения интенсивности для всей дифракционной картины значительно сложнее. Вся картина обладает круговой симметрией и представляет собой чередующиеся светлые и темные кольца, плавно переходящие друг в друга. Если в отверстии экрана укладывается 1-я зона Френеля или ее часть, то интенсивность максимальна в центре картины (т. е. в точке Р) и монотонно убывает при удалении от точки Р. Если отверстие в экране открывает две первые зоны Френеля, то в окрестности Рис.3.8.7. точки Р возникает темное круглое пятно, а вокруг него – светлое кольцо. С увеличением числа m открытых зон в отверстии экрана увеличивается и число светлых и темных колец. На рис.3.8.7 показано распределение интенсивности I от расстояния r до центра дифракционной картины при различном числе m открытых зон Френеля. Когда же в отверстии укладывается большое число зон Френеля, интенсивность вблизи точки Р оказывается почти равномерной и лишь у краев геометрической тени отверстия наблюдается чередование весьма узких светлых и темных кольцевых полос. 2.Дифракция от круглого экрана (преграды). Пусть теперь на пути волны расположен непрозрачный круглый диск. В центре его геометрической тени интенсивность не равна нулю. Если диск перекрывает лишь несколько зон Френеля, то интенсивность в центре геометрической тени почти такая же, как при отсутствии диска. Это непосредственно следует из спирали Френеля (рис.3.8.8), поскольку если диск закрывает, скажем, 1,5 зоны Френеля, то результирующий вектор А при полностью открытой волновой поверхности можно представить как сумму Рис.3.8.8. двух векторов: А А1,5 Аост Так как первые полторы зоны 43 закрыты, то остается только вектор Аост - от всех остальных зон. Этот вектор по модулю лишь немного меньше вектора А . Это светлое пятно в центре геометрической тени называют пятном Пуассона. Рассматривая в свое время метод Френеля, Пуассон пришел к выводу, что в центре тени от диска должно быть светлое пятно, но счел этот вывод столь абсурдным, что выдвинул его как убедительное возражение против волновой теории, развиваемой Френелем. Однако это “абсурдное” предсказание было экспериментально подтверждено Арагоном. Волновая теория Френеля восторжествовала. Приведенный вывод также справедлив при небольшом числе закрытых зон Френеля. Если число закрытых зон очень велико, в центре картины будет наблюдаться минимум близкий к нулю (геометрическая оптика). Зонная пластинка. Если в экране открыть только нечетные зоны Френеля (1-ю, 3-ю,...), то векторы-амплитуды от этих зон будут сонаправлены и в сумме дадут в центре картины вектор, во много раз превосходящий по модулю векторы А и А1. Такой экран называют амплитудной зонной пластинкой. Аналогично можно изготовить зонную пластинку, где открыты только четные зоны Френеля. Зонная пластинка, содержащая n открытых зон, создает в точке Р интенсивность приблизительно в n2 раз большую, чем отверстие в первую зону Френеля. Еще большего эффекта можно достичь, не закрывая четные (или нечетные) зоны, а изменяя фазу колебаний волн, пришедших от этих зон, на . Это можно осуществить с помощью прозрачной пластинки, толщина которой в местах, соответствующих четным (или нечетным) зонам отличается на должным образом подобранную величину, так чтобы ход волны в местах соответствующих четным и нечетным зонам отличался на . Такая пластинка называется фазо2 вой зонной пластинкой. Такая пластинка дает увеличение амплитуды еще в два раза, а интенсивности в четыре. Примером такой пластинки является собирающая линза. Усиление интенсивности света фазовой зонной пластинкой эквивалентно фокусирующему действию линзы. Дополнительные замечания. Вычисления, выполненные на основе принципа Гюйгенса-Френеля, дают, как показывает опыт, правильное распределение интенсивности при дифракции, т.е. позволяют найти правильное значение амплитуды результирующей волны в любой точке экрана, если размеры отверстий или препятствий соизмеримы с длиной волны , другими словами, при не очень больших углах дифракции. При этом, однако, в методе расчета Френеля есть принципиальные неясности. Главные из них заключаются в следующем. 1. При вычислении результатов интерференции элементарных волн приходится считать, что амплитуда колебаний от элементов dS волновой поверхности 44 зависит от угла между нормалью к элементу dS и направлением на точку Р, для которой ведется расчет. Амплитуда максимальна при = 0 и монотонно убывает до нуля при стремлении к π/2, т. е. нет обратной волны. Это обстоятельство остается не обоснованным в теории Френеля. 2. Расчет по методу Френеля дает неправильное значение фазы результирующего колебания. Для полностью открытой волновой поверхности она отличается на π/2 от действительной. Это видно из рисунка спирали Френеля. Направление спирали Френеля в ее начале дает в точке наблюдения фазу колебаний от центрального элемента первой зоны. Это и есть то значение фазы, которое соответствует действительности. Результирующий же вектор от полностью открытой волновой поверхности повернут на π/2 против часовой стрелки, т. е. отстает по фазе на π/2. Таким образом, постулат Френеля, правильно задавая амплитуды вспомогательных источников, неудачно определяет их фазы. Однако, для большинства задач вопрос о фазе не имеет значения, ибо нас интересует интенсивность результирующей волны, которая пропорциональна квадрату амплитуды. Значение же интенсивности метод Френеля дает правильное. Итак, несмотря на некоторые недостатки, метод Френеля в вопросах расчета интенсивности волн для многих случаев является весьма плодотворным. Зоны дифракции. Как уже указывалось, характер дифракционной картины зависит от размеров препятствия. Рассмотренная нами ранее картина, которая носит название дифракции Френеля, наблюдается, когда отверстие оставляет открытыми лишь несколько зон Френеля. Напомним, что тогда в центре картины наблюдается чередование максимумов и минимумов в зависимости от числа открытых зон. Также ранее отмечалось, что если число открытых зон очень велико, то разница в интенсивности при четном или нечетном числе открытых зон мала и лишь у краев геометрической тени отверстия наблюдается чередование весьма узких светлых и темных полос. В этом случае оказывается применимым приближение геометрической оптики. И, наконец, если отверстие оставляет открытой лишь малую часть первой зоны Френеля, то лучи от вторичных источников идут в точку наблюдения практически параллельно и в центре картины никогда не будет минимума. Такой случай носит название дифракции Фраунгофера. Количество «работающих» зон Френеля можно оценить из формулы (3.8.4). Тогда мы получаем параметр, по значению которого можно определить к какой зоне дифракции относится рассматриваемая в данной задаче ситуация. Тогда можно записать: b2 « 1 - дифракция Фраунгофера, r b2 ~ 1 - дифракция Френеля, (3.8.6) r 45 b2 » 1 - геометрическая оптика, r где b - расстояние от преграды до точки наблюдения картины, r - размер преграды (неоднородности), - длина волны. Лекция 3.9 Дифракция Фраунгофера от щели. Дифракционная решетка. Голография. Дифракция Фраунгофера от щели. Соответствующий расчет и здесь будет проведен с помощью принципа Гюйгенса—Френеля. Пусть на бесконечно длинную щель ширины b (длина щели много больше ее ширины) падает нормально плоская волна. Расположим за щелью собирающую линзу, а в ее фокальной плоскости экран (рис.3.9.1). Когда фронт волны совместится с плоскостью щели, мы можем полагать, что в щели находятся вторичные источники. Лучи от этих источников, падающие на линзу параллельным пучком, она соберет в одной точке на экране. Таким образом, в каждой точке экрана картину создают лучи, идущие от вторичных источников параллельным пучком. Поэтому эту картину Рис.3.9.1. называют иногда дифракцией в параллельных лучах. (Такую же картину мы получили бы, если бы экран располагался бесконечно далеко от щели). Разобьем мысленно открытую часть волновой поверхности на очень узкие одинаковые по ширине зоны-полоски, параллельные прямолинейным краям щели. Суммирование вторичных волн проведем с помощью векторной диаграммы (рис.3.9.2).Колебания, приходящие в точку P от каждой такой зоныполоски имеют одинаковую амплитуду dA. При Рис.3.9.2. этом разность фаз между колебаниями, приходящими в точку P от соседних зон-полосок, будет одинакова (проходя через линзу, лучи не приобретают дополнительной разности фаз).Отсюда следует, что при графическом изображении мы получим цепочку векторов dA, одинаковых по модулю и повернутых относительно друг друга на один и тот же угол (рис.3.9.2а). Результирующая амплитуда изобразится вектором A — хордой дуги окружности с центром в точке C. Заметим, что для точки P0 эта цепочка образует прямую, что соответствует максимуму интенсивности. Если разность хода крайних лучей (рис.3.9.1) составляет = , то их разность фаз = 2π, цепочка оказывается замкнутой и амплитуда результирующего коле46 бания обращается в нуль (рис.3.9.2б). Это первый минимум дифракционной картины, представляющей собой симметричную относительно середины систему чередующихся светлых и темных полос, параллельных щели. Результирующая амплитуда обращается в нуль и тогда, когда разность фаз от крайних элементов щели равна 2πm, где m = 1, 2,... Цепочка при этом замыкается после m оборотов, практически не меняя своей длины A0, поскольку угол дифракции обычно достаточно мал. Разность фаз связана с разностью хода соотношением 2 , где — длина волны света. Так как для крайних лучей = bsin (рис.3.9.1) и в минимуме = 2πm, то из этих трех равенств следует условие для минимумов: b sin m m , m = 1, 2, … (3.9.1) Заметим, что m 0, поскольку при m = 0 образуется максимум (цепочка векторов становится прямой). Из этой формулы видно, что уменьшение ширины b щели приводит к расширению дифракционной картины. Количество минимумов интенсивности определяется отношением ширины щели к длине волны. Из (3.9.1) следует Модуль sin не sin ± m /b. может превысить единицу. Поэтому наибольший порядок минимума m ≤ b/ (3.9.2) Таким образом, при ширине щели, меньшей длины волны, минимумы вообще не возникают. В этом случае интенсивность света монотонно убывает от середины картины к ее краям. С другой стороны, если щель очень широкая, как видно из (3.9.1), минимумы будут располагаться очень близко друг от друга, так что максимумы, располагающиеся между ними, сольются и мы получим геометрическое изображение щели (дифракция не наблюдается). Поэтому в приведенном примере мы наблюдаем дифракционную картину лишь вдоль одной координаты в направлении ширины щели График зависимости I от sin показан на рис.3.9.3. Расчеты показывают, что интенсивность второго максимума составляет около 4% от интенсивности центрального, поэтому можно считать, что практически весь световой поток, проходящий через щель, сосредоточен в первом (центральном) максимуме, угловая полуширина которого равна /b. Отметим еще раз, что в середине симметричной Рис.3.9.3. дифракционной картины, состоящей из чередующихся светлых и темных полос, при дифракции Фраунгофера всегда образуется максимум освещенности (в отличие от френелевой дифракции, где центральная полоса может быть как светлой, так и темной). Если плоская световая волна падает на щель наклонно под углом 0 к нормали, то разность хода между колебаниями, распространяющимися от краев щели 47 под углом к нормали, будет равна bsin sin 0 . Это при условии, что оба угла и 0 отсчитываются от нормали в одну сторону — по или против часовой стрелки. Условие дифракционных минимумов в данном случае принимает вид (3.9.3) bsin m sin 0 m , Центральный максимум (m = 0) будет расположен под углом m = 0 , т. е. в направлении падающей волны, и дифракционная картина будет несимметрична относительно центральной светлой полосы. Дифракционная решетка Дифракционная решетка представляет собой стеклянную или металлическую пластинку, на которой нанесено очень много (иногда до сотен тысяч) прямых равноотстоящих штрихов одинаковой конфигурации. Таким образом образуется совокупность прозрачных и непрозрачных участков. Рассмотрим простейшую идеализированную решетку, состоящую из одинаковых равноотстоящих щелей в непрозрачном экране. Пусть ширина каждой щели равна b, а непрозрачного участка а, период решетки — d=b+a. В решетке реализуется многолучевая интерференция когерентных дифрагированных пучков света, исходящих из каждой щели решетки при ее освещении. Дифракционную (точнее дифракционно-интерференционную) картину наблюдают по методу Фраунгофера, т.е. в параллельных лучах, а практически Рис.3.9.4. — в фокальной плоскости объектива (рис.3.9.4a). Пусть плоская монохроматическая световая волна падает на решетку нормально. Каждая из щелей в отдельности давала бы в фокальной плоскости объектива дифракционную картину, показанную на рис.3.9.3. И такие картины от всех щелей в отсутствие когерентности точно накладывались бы друг на друга, независимо от их положения. Интенсивности при этом складывались бы, и мы получили бы при наличии N щелей дифракционную картину как от одной щели, но усиленную в N раз. При освещении же решетки когерентным светом, световые волны от всех щелей интерферируют друг с другом, и дифракционная картина резко меняется. Мы будем наблюдать систему достаточно узких максимумов. Главные максимумы. В середину дифракционно-интерференционной картины когерентные колебания от всех щелей приходят в фазе. Это значит, что если амплитуда от одной щели равна A1, а число щелей в решетке N, то результирующая амплитуда A и соответствующая ей интенсивность I будут определяться формулами 48 A A1N , I I1N 2 . Такой же результат получается и при углах дифракции , для которых оптическая разность хода колебаний от соседних щелей (рис.3.9.4б) равна целому числу длин волн: d sin m m , m = 1, 2, … (3.9.4) где знаки «±» следуют из симметрии дифракционной картины относительно нормали к решетке ( 0 = 0): при знаке плюс угол m > 0, а при знаке минус угол m < 0. В направлениях m , определяемых этим уравнением, возникают максимумы, интенсивность которых в N2 раз превосходят интенсивность от каждой щели в том же направлении. Их называют главными максимумами m-го порядка, а уравнение (3.9.4) — условием главных максимумов. Именно главные максимумы и представляют особый практический интерес. Как мы увидим далее, они получаются тем более узкими и резкими, чем большее число N штрихов содержит решетка. Интерференционные минимумы. Для выяснения дальнейших деталей фраунгоферовой дифракционной картины воспользуемся векторной диаграммой, которая позволит легко найти и результирующую амплитуду A колебаний, приходящих в произвольную точку P фокальной плоскости объектива (рис.3.9.5). Векторная диаграмма в нашем случае представляет собой цепочку векторов-амплитуд Рис.3.9.5. когерентных колебаний, приходящих в точку P от каждой из N щелей: A1, A2,..., AN (рис.3.9.5a). По модулю эти векторы одинаковы, и каждый следующий отстает от предыдущего (или опережает, это не существенно) по фазе на один и тот же угол . Этот угол связан с оптической разностью хода соответствующих лучей от соседних щелей при нормальном падении света на решетку соотношением: 2 2 d sin (3.9.5) , где d — период решетки. Теперь проследим, как будет вести себя эта цепочка векторов (а значит и ее замыкающая A) при удалении точки P от фокуса F, т. е. с ростом угла дифракции . Ясно, что при этом будет увеличиваться разность фаз между колебаниями от соседних щелей, и цепочка векторов будет постепенно закручиваться. Первый раз она замкнется и вектор A обратится в нуль, когда угол N станет равным 2π — это непосредственно видно из рис.3.9.5б. При дальнейшем росте угла , а значит, разности фаз и N, цепочка будет периодически то распрямляться (главные максимумы, А = макс), то замыкаться (интерференционные минимумы, А = 0). Последнее будет происходить при значениях угла N кратных 2π: 49 N 2m, (3.9.6) где m’ принимает целочисленные значения, кроме 0, N, 2N, ... , при которых цепочка распрямляется, и мы получаем главные максимумы. Подставив в (3.9.6) значение из формулы (3.9.5), получим: d sin m . N (3.9.7) Это выражение представляет собой условие для интерференционных минимумов (при целочисленных значениях m’, кроме 0, N, 2N, ...). Оно же содержит и условие (3.9.4) для главных максимумов (при m’ = 0, N, 2N, ...). Между двумя соседними главными максимумами расположены N – 1 интерференционных минимумов. А между последними, в свою очередь, — добавочные максимумы, интенсивность которых при достаточно большом числе N штрихов решетки пренебрежимо мала (она составляет не более 5% от интенсивности главных максимумов). В отличие от условия (3.9.4), которое дает только положения главных максимумов, соотношение (3.9.7) позволяет определить и их угловую ширину. В самом деле, при переходе от главного максимума к соседнему минимуму (рис.3.9.6) m’ меняется на единицу, например от N до N + 1. Тогда при достаточно большом N угловую полуширину главного максимума 1-го порядка Рис.3.9.6. можно найти, взяв дифференциал уравнения (3.9.7) с учетом того, что m’ при этом меняется на единицу (m’ = 1). Тогда d cos / N , откуда Nd cos h cos . (3.9.8) Обращает на себя внимание тот факт, что зависит не от d и N в отдельности, а от их произведения, которое есть не что иное, как ширина решетки h = Nd. С ростом угла дифракции ширина главных максимумов увеличивается. Главные максимумы будут тем уже, чем больше ширина решетки h и меньше угол дифракции . Теперь выясним, что означает утверждение, например, «угловая ширина главного максимума мала». По сравнению с чем? Ответ достаточно очевидный: величину надо сравнивать с угловой шиной между соседними главными максимумами. Если « , мы говорим, что главные максимумы узкие (резкие). Оценим отношение этих двух величин. Значение соответствует изменению m’ в (3.9.7) на единицу, но таких значений m’ между двумя соседними главными максимумами оказывается N. Считая, что на каждый интервал m’ = 1 приходится одно и то же значение (для оценки), приходим к выводу, что в N раз меньше, чем . Итак, резкость главных максимумов пропорциональна числу штрихов решетки (более точный расчет приводит к тому же результату). Таким образом, с помощью условий (3.9.4) и (3.9.7) мы можем установить не только положения главных максимумов, но и их угловую ширину (резкость). 50 Остается решить вопрос об их интенсивности. Рассмотрим его сначала качественно. Прослеживая поведение векторной диаграммы по мере увеличения угла дифракции , мы оставили без внимания тот факт, что при этом каждый вектор цепочки по модулю будет уменьшаться, ибо он определяется дифракцией от каждой щели. Результирующий вектор при закручивании цепочки будет сначала уменьшаться и в дальнейшем вести себя аналогично тому, как показано на рис3.9.3 зависимости I от sin . Следовательно, кроме интерференционных минимумов, необходимо иметь в виду и дифракционные минимумы, определяемые условием (3.9.1), т. е. b sin m m , m 1, 2, ... , где b — ширина каждой щели. При этом условии все векторы цепочки обращаются в нуль, значит и результирующая интенсивность в этих направлениях всегда должна быть равна нулю. Даже в том случае, если этому направлению соответствует главный максимум m-го порядка. Интенсивность главных максимумов. Распределение интенсивности в дифракционно-интерференционной картине проще всего получить с помощью векторных диаграмм (рис.3.9.5 и 3.9.2). В итоге получим следующее выражение: I I0 где, напомним, 2b sin / , sin 2 / 2 sin 2 N / 2 / 22 sin 2 / 2 , (3.9.9) 2d sin / . Полученный результат (3.9.9) графически представлен на рис.3.9.7 как зависимость интенсивности дифракционной картины от синуса угла дифракции . Как видим, интерференция многих пучков привела Рис.3.9.7. к резкому перераспределению интенсивности света, обусловленному дифракцией от каждой щели. Первая дробь в выражении (3.9.9) представляет собой плавную функцию от sin (она показана пунктиром на рисунке и отражает дифракционное распределение интенсивности от каждой щели). Эта плавная функция модулирует многолучевую интерференционную картину от N щелей, которую описывает вторая дробь в формуле (3.9.9). Практически наиболее важными являются главные максимумы, попадающие в центральный дифракционный максимум от каждой щели — они являются наиболее интенсивными. Дифракционная решетка как спектральный прибор. Дифракционная решетка является важнейшим спектральным прибором, предназначенным для разложения света в спектр и измерения длин волн. Из формулы (3.9.4), определяющей направления на главные фраунгоферовы максимумы, видно, что эти направления m зависят от длины световой волны (за 51 исключением максимума нулевого порядка, m = 0). Поэтому решетка в каждом порядке m 0 разложит падающий на нее свет в спектр различных порядков. Причем наибольшее отклонение в каждом порядке испытывает красная часть спектра (более длинноволновая). Основными характеристиками любого спектрального прибора являются угловая дисперсия, разрешающая способность и область дисперсии. 1. Угловая дисперсия D характеризует степень пространственного (углового) разделения волн с различными длинами . По определению, (3.9.10) D d / d. где d - разность длин волн, дающих максимум данного порядка, d - разность углов под которыми эти максимумы наблюдаются. Дифференцируя формулу (3.9.4) при данном m находим для решетки d cosd md , откуда d m . d d cos (3.9.11) Видно, что для заданного порядка m спектра угловая дисперсия тем больше, чем меньше период d решетки. Кроме того, d / d растет с увеличением угла дифракции . 2. Разрешающая способность R. По определению, R / , (3.9.12) где — наименьшая разность длин волн спектральных линий, при которой эти линии воспринимаются еще раздельно, т. е. разрешаются. Величина R не может быть по ряду причин определена точно, а лишь ориентировочно (условно). Такой условный критерий был предложен Рэлеем. Согласно критерию Рэлея, спектральные линии с разными длинами волн, но одинаковой интенсивности, Рис.3.9.8. считаются разрешенными, если главный максимум одной спектральной линии совпадает с первым минимумом другой (рис.3.9.8). В этом случае между двумя максимумами возникает провал, составляющий около 20% от интенсивности в максимумах, и линии еще воспринимаются раздельно. Итак, согласно критерию Рэлея и формуле (3.9.9), необходимо, чтобы максимум m-го порядка (m’ = mN) линии с длиной волны + (рис.3.9.8) совпадал по направлению с первым минимумом линии (m’ = mN + 1), т. е. 1 d sin m m m . N Отсюда следует, что / mN. (3.9.13) Это и есть искомая формула для разрешающей способности дифракционной решетки. Данная формула дает верхний предел разрешающей способности. Она справедлива при выполнении следующих условий: 1. Интенсивность обоих максимумов должна быть одинаковой. 2. Расширение линий должно быть обусловлено только дифракцией. 52 3. Необходимо, чтобы падающий на решетку свет имел ширину когерентности, превышающую размер решетки. Только в этом случае все N штрихов решетки будут “работать” согласованно (когерентно), и мы достигнем желаемого результата. Для повышения разрешающей способности спектральных приборов можно, как показывает формула (3.9.13), либо увеличивать число N когерентных пучков, либо повышать порядок интерференции m. Первое используется в дифракционных решетках (число N доходит до 200 000), второе — в интерференционных спектральных приборах (например, в интерферометре Фабри—Перо число N интерферирующих волн невелико, порядка нескольких десятков, а порядки интерференции m 106 и более). 3. Область дисперсии — это ширина спектрального интервала, при которой еще нет перекрытия спектров соседних порядков. Если спектры соседних порядков перекрываются, то спектральный аппарат становится непригодным для исследования соответствующего участка спектра. Длинноволновый конец спектра m-го порядка совпадает с коротковолновым концом спектра (m + 1)-го порядка, если m( + ) = (m + 1) , откуда следует, что область дисперсии / m. (3.9.14) Значит, область дисперсии обратно пропорциональна порядку спектра т. При работе со спектрами низких порядков (обычно второго или третьего) дифракционная решетка пригодна для исследования излучения, занимающего достаточно широкий спектральный интервал. Дифракция на двумерных и трехмерных решетках. Двумерной решеткой называется структура, свойства которой периодически меняются в двух направлениях. Примером могут служить две скрещенные одномерные решетки, т.е. наложенные одна на другую под некоторым углом. Дифракционная картина от такой структуры может быть получена путем наложения дифракционных картин от соответствующих одномерных решеток. Трехмерные, пространственные решетки обладают периодичностью в трех различных направлениях. Они играют важную роль в физике рентгеновских лучей. Дифракцию рентгеновских лучей на оптических дифракционных решетках получить нельзя, так как длина волны рентгеновского излучения имеет порядок 0,1нм, т.е. значительно меньше ширины щели оптической решетки. Дифракцию рентгеновских лучей можно наблюдать, если использовать кристаллическую структуру, как естественную периодическую пространственную решетку. В этом случае картина получается весьма сложной. Однако, ее можно использовать как для изучения спектрального состава излучения (если известны параметры кристалла), так и для определения характеристик кристалла (если известна длина волны излучения. Голография. 53 Голография (от греческого холос – полный, графо – пишу) – способ получения объемных изображений предметов на фотопластинке при помощи когерентного излучения. При освещении предмета от него распространяется рассеянная волна. Эта волна несет полную информацию о форме и других свойствах предмета. Попадая в глаз или объектив фотоаппарата, она образует на сетчатке или фотопластинке изображение. По степени почернения фотопластинки можно судить об амплитуде рассеянной волны. Таким образом, пластинка в этом случае сохраняет информацию только об амплитуде волны. Мы получаем плоское изображение. Для восстановления волнового поля в полном объеме (объемного изображения) этой информации недостаточно. Нужна еще информация о фазе, которую пластинка не содержит. В 1947году английский физик и инженер Д.Габор показал, что необходимую информацию о фазе можно получить и записать на той же фотопластинке, если осветить ее вторым пучком от того же когерентного источника и заставить его интерферировать с пучком, рассеянным предметом. Голограмма фиксирует не само изображение предмета, а структуру отраженной от него световой волны (амплитуду и фазу). Для получения голограммы необходимо, чтобы на фотопластинку одновременно попали два когерентных световых пучка: предметный, отраженный от снимаемого объекта, и опорный – приходящий непосредственно от источника. Свет обоих пучков интерферирует, создавая на пластинке чередование темных и светлых интерференционных полос. Рис.3.9.9. Принципиальная схема устройства для записи голограммы приведена на рис.3.9.9. В этой схеме луч лазера делится специальным устройством на два. После этого лучи с помощью линз расширяются и с помощью зеркал направляются на объект и фотопластинку. Свет обоих пучков интерферирует, создавая на пластинке чередование темных и светлых полос. На экспонированной таким образом и проявленной пластинке отсутствует какое-либо изображение. Однако его в зашифрованном виде содержит система интерференционных полос. Если голограмму просветить, как диапозитив, лазерным светом той же частоты, что была использована при записи, возникнет «восстановленная голограмма» объемное изображение предмета, словно висящее в пространстве. Меняя точку наблюдения, можно заглянуть за предметы на первом плане и увидеть детали, ранее скрытые от взгляда. Свет, проходя сквозь систему полос голограммы, дифрагирует и воспроизводит волновой фронт, исходивший от снятого предмета. Аналогичным образом лазерный луч, пропущенный через маленькое отверстие, дает на фотопластинке, поставленной за отверстием систему колец (ди54 фракция Френеля). А световой пучок, проходящий сквозь такую пластинку, сойдется в точку. Таким образом, система колец, полученная при дифракции Френеля представляет собой простейшую голограмму – голограмму точки. ЭЛЕМЕНТЫ КВАНТОВОЙ ФИЗИКИ. Лекция 3.10. Тепловое излучение. Формула Планка. Тепловое излучение и люминесценция Излучение телами электромагнитных волн (свечение тел) может осуществляться за счет различных видов энергии. Самым распространенным является тепловое излучение, т. е. испускание электромагнитных волн за счет внутренней энергии тел. Все остальные виды свечения, возбуждаемые за счет любого вида энергии, кроме внутренней (тепловой), объединяются под общим названием «люминесценция». Окисляющийся на воздухе фосфор светится за счет энергии, выделяемой при химическом превращении. Такой вид свечения называется хемилюминесценцией. Свечение, возникающее в газах и твердых телах под воздействием электрического поля, называется электролюминесценцией. Свечение твердых тел, вызванное бомбардировкой их электронами, называют катодолюминесценцией. Свечение, возбуждаемое поглощаемым телом электромагнитным излучением, называется фотолюминесценцией. Тепловое излучение имеет место при любой температуре, однако при невысоких температурах излучаются практически лишь длинные (инфракрасные) электромагнитные волны. Окружим излучающее тело оболочкой с идеально отражающей поверхностью (рис. 3.10.1). Воздух из оболочки удалим. Отраженное оболочкой излучение, упав на тело, поглотится им (частично или полностью). Следовательно, будет происходить непрерывный обмен энергией между телом и заполняющим оболочку излучением. Если распределение энергии между телом и излучением остается неизменным для каждой длины волны, состояние системы тело — излучение будет равновесным. Опыт показывает, что единственным видом излучения, которое может находиться Рис.3.10.1. в равновесии с излучающими телами, является тепловое излучение. Все остальные виды излучения оказываются неравновесными. Способность теплового излучения находиться в равновесии с излучающими телами обусловлена тем, что его интенсивность возрастает при повышении температуры. Допустим, что равновесие между телом и излучением нарушено и тело излучает энергии больше, чем поглощает. Тогда внутренняя энергия тела будет убывать, что приведет к понижению температуры. Это в свою очередь 55 обусловит уменьшение количества излучаемой телом энергии. Температура тела будет понижаться до тех пор, пока количество излучаемой телом энергии не станет равным количеству поглощаемой энергии. Если равновесие нарушится в другую сторону, т. е. количество излучаемой энергии окажется меньше, чем поглощаемой, температура тела будет возрастать до тех пор, пока снова не установится равновесие. Таким образом, нарушение равновесия в системе тело — излучение вызывает возникновение процессов, восстанавливающих равновесие. Иначе обстоит дело в случае люминесценции. Покажем это на примере хемилюминесценции. Пока протекает обусловливающая излучение химическая реакция, излучающее тело все больше и больше удаляется от первоначального состояния. Поглощение телом излучения не изменит направления реакции, а наоборот, приведет к более быстрому (вследствие нагревания) протеканию реакции в первоначальном направлении. Равновесие установится лишь тогда, когда будет израсходован весь запас реагирующих веществ и свечение, обусловленное химическими процессами, заменится тепловым излучением. Итак, из всех видов излучения равновесным может быть только тепловое излучение. К равновесным состояниям и процессам применимы законы термодинамики. Поэтому тепловое излучение должно подчиняться некоторым общим закономерностям, вытекающим из принципов термодинамики. К рассмотрению этих закономерностей мы и перейдем. Характеристики излучения и излучающего тела. Обозначим через u плотность энергии излучения, т.е. количество энергии в единице объема. Излучение представляет собой совокупность волн различных частот (бегущих или стоячих). Поскольку плотность энергии излучения разной частоты различна, обозначим u d объемную плотность лучистой энергии, приходящийся на интервал частот , d. Очевидно, что u u d . (3.10.1) 0 Интенсивность теплового излучения мы будем характеризовать величиной потока энергии, измеряемой в ваттах. Энергия излучения связана с излучающим телом. Поток энергии, испускаемый единицей поверхности излучающего тела по всем направлениям (в пределах телесного угла 2π), называют энергетической светимостью тела. Мы будем обозначать эту величину буквой R. Энергетическая светимость является функцией температуры. Излучение состоит из волн различных частот ω (или длин ). Обозначим поток энергии, испускаемый единицей поверхности тела в интервале частот dω, через dRω. При малом интервале dω поток dRω будет пропорционален dω: dR r d . (3.10.2) Величина rω называется испускательной способностью тела. Как и энергетическая светимость, испускательная способность сильно зависит от температуры тела. Таким образом, rω есть функция частоты и температуры. Испуска56 тельная способность это поток энергии, излучаемый единицей поверхности тела во всех направлениях в единичном интервале частот вблизи . Энергетическая светимость связана с испускательной способностью формулой RT dRT rT d (3.10.3) 0 (чтобы подчеркнуть, что энергетическая светимость и испускательная способность зависят от температуры, мы их снабдили индексом Т). Излучение можно характеризовать вместо частоты ω длиной волны. Участку спектра dω будет соответствовать интервал длин волн dλ. Определяющие один и тот же участок величины dω и dλ связаны простым соотношением, вытекающим из формулы λ=2πc/ω. Дифференцирование дает: 2c 2 d 2 d d . (3.10.4) 2c Знак минус в этом выражении не имеет существенного значения, он лишь указывает на то, что с возрастанием одной из величин, ω или λ, другая величина убывает. Поэтому минус в дальнейшем мы не будем писать. Доля энергетической светимости, приходящаяся на интервал dλ, может быть по аналогии с (3.10.2) представлена в виде: dR r d . (3.10.5) Если интервалы dω и dλ, входящие в выражения (3.10.2) и (3.10.5), связаны соотношением (3.10.4), т. е. относятся к одному и тому же участку спектра, то величины dRω и dRλ должны совпадать: Заменив в последнем равенстве dλ согласно (3.10.4), получим откуда 2c 2 r . (3.10.6) 2 2c С помощью формулы (3.10.6) можно перейти от rλ к rω и наоборот. Пусть на элементарную площадку поверхности тела падает поток лучистой энергии dФω, обусловленный электромагнитными волнами, частота которых заключена в интервале dω. Часть этого потока dФ’ω будет поглощена телом, Безразмерная величина dФ ! а Т (3.10.7) dФ называется поглощательной способностью тела. Поглощательная способность тела есть функция частоты и температуры. Поглощательная способность это доля энергии, поглощенная телом из падающего на него потока. По определению aωT не может быть больше единицы. Для тела, полностью поглощающего упавшее на него излучение всех частот, aωT = 1. Такое тело называется абсолютно черным. Будем в дальнейшем обозначать испускательr r 57 ную и поглощательную способность абсолютно черного тела rT и aT . Тело, для которого aωT ≡ aT =const<1, называют серым. Если а Т = 0, это или абсолютно прозрачное тело или абсолютно зеркальное. Закон Кирхгофа. Между испускательной и поглощательной способностями любого тела имеется связь. В этом можно убедиться, рассмотрев следующий эксперимент. Пусть внутри замкнутой оболочки, поддерживаемой при постоянной температуре Т, помещены несколько тел (рис.3.10.2). Полость внутри оболочки эвакуирована (там отсутствуют молекулы какого-либо вещества), так что тела могут обмениваться энергией между собой и с оболочкой лишь путем испускания и поглощения электромагнитных волн. Опыт показывает, что такая система через некоторое время придет в состояние теплового равновесия — все тела примут одну и ту же температуру, равную температуре оболочки Т. В Рис.3.10.2. таком состоянии тело, обладающее бóльшей испускательной способностью rωT, теряет в единицу времени с единицы поверхности больше энергии, чем тело, обладающее меньшей rωT. Поскольку температура (а, следовательно, и энергия) тел не меняется, то тело, испускающее больше энергии, должно и больше поглощать, т. е. обладать большей aωT. Таким образом, чем больше испускательная способность тела rωT, тем больше и его поглощательная способность aωT. Отсюда вытекает соотношение rT rT rT ... , (3.10.8) a T 1 a T 2 a T 3 где индексы 1, 2, 3 и т. д. относятся к разным телам. Соотношение (3.10.8) выражает установленный Кирхгофом закон, который формулируется следующим образом: отношение испускательной и поглощательной способностей не зависит от природы тела, оно является для всех тел одной и той же (универсальной) функцией частоты (длины волны) и температуры: rT (3.10.9) f , T . aT Сами величины rωT и aωT могут меняться чрезвычайно сильно при переходе от одного тела к другому. Отношение же их оказывается одинаковым для всех тел. Это означает, что тело, сильнее поглощающее какие-либо лучи, будет эти лучи сильнее и испускать (не следует смешивать испускание лучей с их отражением). Функция называется функцией Кирхгофа. Для абсолютно черного тела по определению aωT = 1. Следовательно, из формулы (3.10.9) вытекает, что rωT для такого тела равна f(ω, Т). Таким образом, универсальная функция Кирхгофа f(ω, Т) есть не что иное, как испускательная способность абсолютно черного тела f ,T rT 58 При теоретических исследованиях для характеристики спектрального состава равновесного теплового излучения удобнее пользоваться функцией частоты f(ω,Т). В экспериментальных работах удобнее пользоваться функцией длины волны φ(λ, Т). Обе функции связаны друг с другом формулой (3.10.10) аналогичной формуле (3.10.6). Согласно (3.10.10) для того, чтобы по известной функции f(ω, Т) найти φ(λ, Т), нужно заменить в f(ω, Т) частоту ω через 2πс/λ и получившееся выражение умножить на 2πс/λ2: (3.10.11) Для нахождения f(ω, Т) по известной φ(λ, Т) нужно воспользоваться соотношением (3.10.12) Абсолютно черных тел в природе не существует. Сажа или платиновая чернь имеют поглощательную способность aωT, близкую к единице, лишь в ограниченном интервале частот; в далекой инфракрасной области их поглощательная способность заметно меньше единицы. Однако можно создать устройство, сколь угодно близкое по своим свойствам к абсолютно черному телу. Такое устройство представляет собой почти замкнутую полость, снабженную малым отверстием (рис. 3.10.3). Излучение, проникшее внутрь через отверстие, прежде чем выйти обратно из отверстия, претерпевает многократные отражения. При каждом отражении часть энергии поглощается, в результате Рис.3.10.3. чего практически все излучение любой частоты поглощается такой полостью. Согласно закону Кирхгофа испускательная способность такого устройства очень близка к f(ω, Т), причем Т означает температуру стенок полости. Таким образом, если стенки полости поддерживать при некоторой температуре Т, то из отверстия выходит излучение, весьма близкое по спектральному составу к излучению абсолютно черного тела при той же температуре. Проводя эксперимент и разлагая это излучение в спектр с помощью дифракционной решетки можно измерить интенсивность различных участков спектра.Такой эксперимент дает можно вид функции f(ω,Т) или φ(λ, Т). Результаты таких опытов приведены на рис.3.10.4. Разные кривые относятся к различным значениям температуры Т абсолютно черного тела. Площадь, охватываемая кривой, дает энергетическую светимость абсолютно черного тела при соответствующей температуре. Из рис.3.10.4 следует, что энергетическая светимость абсолютно черного тела сильно возрастает с температурой. Максимум испускательной способности с увеличением темпераРис.3.10.4. туры сдвигается в сторону более коротких волн. 59 Равновесная плотность энергии излучения Рассмотрим излучение, находящееся в равновесии с веществом. Для этого представим себе эвакуированную полость, стенки которой поддерживаются при постоянной температуре Т. В равновесном состоянии энергия излучения будет распределена в объеме полости с определенной плотностью u = u(T). Спектральное распределение этой энергии можно охарактеризовать функцией u(ω,T), определяемой условием duω= u(ω,T) d , где duω — доля плотности энергии, приходящаяся на интервал частот dω. Полная плотность энергии u(T) связана с функцией u(ω,T) формулой (3.10.1). Из термодинамических соображений следует, что равновесная плотность энергии излучения u(T) зависит только от температуры и не зависит от свойств стенок полости. Рассмотрим две полости, стенки которых изготовлены из разных материалов и имеют первоначально одинаковую температуру. Допустим, что равновесная плотность энергии в обеих полостях различна и, скажем, u1(T)>u2(T). Соединим полости с помощью небольшого отверстия (рис.3.10.5) и тем самым позволим стенкам полостей вступить в теплообмен через излучение. Так как по предположению u1>u2, поток энергии из первой полости во вторую должен быть больше, чем поток, текущий во встречном Рис.3.10.5 направлении. В результате стенки второй полости станут поглощать больше энергии, чем излучать, и температура их начнет повышаться. Стенки же первой полости станут поглощать меньше энергии, чем излучать, так что они будут охлаждаться. Однако два тела с первоначально одинаковой температурой не могут вследствие теплообмена друг с другом приобрести различные температуры — это запрещено вторым началом термодинамики. Поэтому наше допущение о неодинаковости u1 и u2 должно быть признано неправомерным. Вывод о равенстве u1(T) и u2(T) распространяется на каждую спектральную составляющую u(ω, T). Независимость равновесного излучения от природы стенок полости можно пояснить следующими соображениями. Абсолютно черные стенки поглощали бы всю упавшую на них энергию Фэ и испускали бы такой же поток энергии Фэ. Стенки с поглощательной способностью а поглотят долю aФэ упавшего на них потока Фэ и отразят поток, равный (1-a)Фэ. Кроме того, они излучат поток aФэ (равный поглощенному потоку). В итоге стенки полости вернут излучению такой же поток энергии Фэ = (1-a)Фэ + aФэ, какой возвращали бы излучению абсолютно черные стенки. Равновесная плотность энергии излучения u связана с энергетической светимостью абсолютно черного тела R* простым соотношением, которое мы сейчас выведем. Рассмотрим эвакуированную полость с абсолютно черными стенками. В случае равновесия через каждую точку внутри полости будет проходить в любом направлении поток излучения одинаковой плотности. Если бы излучение распространя60 лось Рис.3.10.6. в одном заданном направлении (т. е. через данную точку проходил только один луч), плотность потока энергии в рассматриваемой точке была бы равна произведению плотности энергии u на скорость электромагнитной волны c. Однако через каждую точку проходит множество лучей, направления которых равномерно распределены в пределах телесного угла 4π. Поток энергии равномерно распределен в пределах этого телесного угла. Следовательно, в каждой точке в пределах телесного угла d будет течь поток энергии, плотность которого равна Возьмем на поверхности полости элементарную площадку ΔS (рис.3.10.6). Эта площадка посылает в пределах телесного угла dΩ=sinυdυdφ в направлении, образующем с нормалью угол υ, поток энергии По всем направлениям, заключенным в пределах телесного угла 2π, площадка ΔS посылает поток энергии (3.10.13) Вместе с тем поток энергии, испускаемый площадкой, можно найти, умножив энергетическую светимость R* на ΔS: ΔФэ=R*ΔS. Сравнение с (3.10.13) дает, что (3.10.14) Равенство (3.10.14) должно выполняться для каждой спектральной составляющей излучения. Отсюда вытекает, что (3.10.15) Эта формула связывает испускательную способность абсолютно черного тела с равновесной плотностью энергии теплового излучения. Закон Стефана — Больцмана и закон Вина. Теоретическое объяснение законов излучения абсолютно черного тела имело огромное значение в истории физики – оно привело к понятию квантов энергии. Долгое время попытки получить теоретически вид функции f(ω, Т) не давали общего решения задачи. Стефан (1879), анализируя экспериментальные данные, пришел к выводу, что энергетическая светимость R любого тела пропорциональна четвертой степени абсолютной температуры. Однако последующие более точные измерения показали ошибочность его выводов. Больцман (1884), исходя из термодинамических соображений, получил теоретически для энергетической светимости абсолютно черного тела следующее значение: (3.10.16) 61 где σ – постоянная величина, Т – абсолютная температура. Таким образом, заключение, к которому Стефан пришел для нечерных тел (с абсолютно черными телами он не экспериментировал), оказалось справедливым лишь для абсолютно черных тел. Соотношение (3.10.16) между энергетической светимостью абсолютно черного тела и его абсолютной температурой получило название закона Стефана – Больцмана. Константу σ называют постоянной Стефана – Больцмана. Ее экспериментальное значение равно Вин (1893), воспользовавшись, кроме термодинамики, электромагнитной теорией, показал, что функция спектрального распределения должна иметь вид (3.10.17) где F — некоторая функция отношения частоты к температуре. Согласно формуле (3.10.11) для функции φ(λ, Т) получается выражение (3.10.17) где ψ(λ, Т) некоторая функция произведения λТ. Соотношение (3.10.17) позволяет установить зависимость между длиной волны λm, на которую приходится максимум функции φ(λ, Т) и температурой. Продифференцируем это соотношение по λ: (3.10.18) Выражение в квадратных скобках представляет собой некоторую функцию Ψ(λ, Т). При длине волны λm, соответствующей максимуму функции φ(λ, Т), выражение (3.10.18) должно обращаться в нуль: Из опыта известно, что λm конечно (λm ≠ ∞). Поэтому должно выполняться условие: Ψ(λmТ) = 0. Решение последнего уравнения относительно неизвестного λmТ дает для этого неизвестного некоторое число, которое мы обозначим буквой b. Таким образом, получается соотношение которое носит название закона смещения Вина: длина волны, на которую приходится максимум излучательной способности абсолютно черного тела, обратно пропорциональна его абсолютной температуре b (3.10.19) т . T Экспериментальное значение константы b равно Формула Рэлея — Джинса. Рэлей и Джинс сделали попытку определить равновесную плотность излучения u(ω, Т), исходя из теоремы классической статистики о равнораспределении энергии по степеням свободы. Они предположили, что на каждое электромагнитное колебание приходится в среднем энергия, равная двум половинкам kT – 62 одна половинка на электрическую, вторая — на магнитную энергию волны (напомним, что по классическим представлениям на каждую колебательную степень свободы приходится в среднем энергия, равная двум половинкам kТ). Равновесное излучение в полости представляет собой систему стоячих волн. С учетом возможных видов поляризации количество стоячих волн, отнесенное к единице объема полости, определяется формулой (3.10.20) Как мы уже отмечали, Рэлей и Джинс, исходя из закона равнораспределения энергии по степеням свободы, приписали каждому колебанию энергию ‹ε›, равную kT. Умножив (3.10.20) на ‹ε›, получим плотность энергии, приходящуюся на интервал частот dω: Отсюда (3.10.21) Перейдя от u(ω, Т) к f(ω, Т), получим выражение для испускательной способности абсолютно черного тела: (3.10.22) Выражения (3.10.21) и (3.10.22) называются формулой Рэлея — Джинса. Эта формула удовлетворительно согласуется с экспериментальными данными лишь при больших длинах волн и резко расходится с опытом для малых длин волн (см. рис.3.10.7, на котором сплошной линией изображена экспериментальная кривая, пунктиром кривая, построенная по формуле Рэлея — Джинса). Интегрирование выражения (3.10.22) по ω в пределах от 0 до ∞ дает для равновесной плотности энергии u(Т) бесконечно большое значение. Этот результат, получивший название ультрафиолетовой катастрофы, также находится в противоречии с опытом. Равновесие между излучением и излучающим Рис.3.10.7. телом устанавливается при конечных значениях u(Т). Формула Планка. С классической точки зрения вывод формулы Рэлея—Джинса является безупречным. Поэтому расхождение этой формулы с опытом указывало на существование каких-то закономерностей, несовместимых с представлениями классической физики. В 1900 г. Планку удалось найти вид функции u(ω, Т), в точности соответствующий опытным данным: 63 (3.10.23) Для этого ему пришлось сделать предположение совершенно чуждое классическим представлениям, а именно допустить, что электромагнитное излучение испускается в виде отдельных порций энергии (квантов), величина которых пропорциональна частоте излучения: (3.10.24) Коэффициент пропорциональности получил впоследствии название постоянная Планка. Исходя из выдвинутого предположения, Планк получил значение средней энергии излучения частоты : , (3.10.25) exp kT 1 откуда с учетом (3.10.20) и следует формула Планка. Заметим в конце, что для малых частот, когда « kT , выражение (3.10.25) дает классическое kT . Лекция 3.11. Тормозное рентгеновское излучение. Фотоэффект. Формула Эйнштейна. Фотоны. Тормозное рентгеновское излучение. В предыдущей лекции мы говорили, что для объяснения свойств теплового излучения пришлось ввести представление об испускании электромагнитного излучения порциями ћ. Квантовая природа излучения подтверждается также рядом других явлений. Одним из них является существование так называемой коротковолновой границы тормозного рентгеновского излучения. Рентгеновские лучи возникают при бомбардировке Рис.3.11.1 быстрыми электронами твердых мишеней. Рентгеновская трубка (рис.3.11.1) представляет собой эвакуированный баллон с несколькими электродами. Нагреваемый током катод K служит источником свободных электронов, испускаемых вследствие термоэлектронной эмиссии. Цилиндрический электрод Ц предназначен для фокусировки электронного пучка. Мишенью является анод A, который называют также антикатодом. Его делают из тяжелых металлов (W, Сu, Pt и т.д.). Ускорение электронов осуществляется высоким напряжением, создаваемым между катодом и антикатодом. Почти вся энергия электронов выделяется на антикатоде в виде тепла (в излучение превращается лишь 1—3 % энергии). Поэтому в мощных трубках антикатод приходится интенсивно охлаждать. С этой целью в 64 теле антикатода делаются каналы, по которым циркулирует охлаждающая жидкость (вода или масло). Если между катодом и антикатодом приложено напряжение U, электроны разгоняются до энергии eU. Попав в вещество антикатода, электроны испытывают сильное торможение и становятся источником электромагнитных волн. Мощность излучения Ρ пропорциональна квадрату заряда электрона е и квадрату его ускорения а: Р ~ е2а 2 . Предположим, что ускорение электрона остается постоянным в течение всего времени торможения τ. Тогда мощность излучения также будет постоянной, и за е 2V02 время торможения электрон излучит энергию , Е Р ~ е 2 а 2 где V0 — начальная скорость электрона. Полученный результат показывает, что заметное излучение может наблюдаться лишь при резком торможении быстрых электронов. На рентгеновские трубки подается напряжение до 50 кB. Пройдя такую разность потенциалов, электрон приобретает скорость, равную 0,4c (с – скорость света). Электроны могут быть ускорены также в бетатроне. В бетатроне электроны могут быть ускорены до энергии в 50 МэВ. Скорость электронов при такой энергии составляет 0,99995 с. Направив ускоренный в бетатроне пучок электронов на твердую мишень, получают рентгеновские лучи весьма малой длины волны. Чем меньше длина волны, тем меньше поглощаются лучи в веществе. Поэтому рентгеновские лучи, получаемые на бетатроне, обладают особенно большой проникающей способностью. При достаточно большой скорости электронов, кроме тормозного излучения (т. е. излучения, обусловленного торможением электронов), возбуждается также характеристическое излучение (вызванное возбуждением внутренних электронных оболочек атомов антикатода). Сейчас нас будет интересовать лишь тормозное излучение. Согласно классической электродинамике при торможении электрона должны возникать волны всех длин — от нуля до бесконечности. Длина волны, на которую приходится максимум мощности излучения, должна уменьшаться по мере увеличения скорости электронов, т. е. напряжения на трубке U. На рис.3.11.2 даны экспериментальные кривые распределения мощности тормозного рентгеновского излучения по длинам волн, полученные для разных значений U. Как видно из Рис.3.11.2. рисунка, выводы теории в основном подтверждаются на опыте. Однако имеется одно принципиальное отступление от требований классической электродинамики. Оно заключается в том, что кривые распределения мощности не идут к началу координат, а обрываются при конечных значениях длины волны λmin. Экспериментально установлено, что коротковолновая граница тормозного рентгеновского спектра λmin связана с ускоряющим напряжением U соотношением λmin=12390/U, (3.11.1) 65 где λmin выражена в ангстремах (1 ангстрем (Å) составляет 10 10 м), a U — в вольтах. Существование коротковолновой границы непосредственно вытекает из квантовой природы излучения. Действительно, если излучение возникает за счет энергии, теряемой электроном при торможении, то величина излученного кванта ħω не может превысить энергию электрона eU ħω≤eU. Отсюда получается, что частота излучения не может превысить значения ωmax=eU/ħ, а следовательно, длина волны не может быть меньше значения λmin =2πc /ωmax=(2πħ c/e)/U. (3.11.2) Таким образом, мы пришли к эмпирическому соотношению (3.11.1). Найденное из сопоставления формул (3.11.1) и (3.11.2) значение ħ хорошо согласуется со значениями, определенными иными способами. Из всех методов определения ħ метод, основанный на измерении коротковолновой границы тормозного рентгеновского спектра, считается самым точным. Фотоэффект. Формула Эйнштейна. Фотоэлектрическим эффектом или фотоэффектом называется испускание электронов веществом под действием света. Это явление было открыто Г. Герцем в 1887 г. Он заметил, что проскакивание искры между шариками разрядника значительно облегчается, если один из шариков осветить ультрафиолетовыми лучами. В 1888—1889 гг. А. Г. Столетов подверг фотоэффект систематическому исследованию с помощью установки, схема которой показана на рис.3.11.3. Конденсатор, образованный проволочной сеткой и сплошной пластиной, был включен последовательно с гальванометром G в цепь батареи. Свет, проходя через сетку, падал на сплошную пластину. В результате в цепи возникал ток, регистрировавшийся гальванометром. На основании своих опытов Столетов пришел к следующим выводам: 1) наибольшее действие оказывают ультрафиолетовые лучи; Рис.3.11.3. 2) сила тока возрастает с увеличением освещенности пластины; 3) испускаемые под действием света заряды имеют отрицательный знак. Спустя 10 лет (в 1898 г,) Ленард и Томсон, измерив удельный заряд испускаемых под действием света частиц, установили, что эти частицы являются электронами. Ленард и другие исследователи усовершенствовали прибор Столетова, поместив электроды в эвакуированный баллон (рис3.11.4). Свет, проникающий через кварцевое окошко Кв, освещает катод К, изготовленный из исследуемого материала. Электроны, испущенные вследствие фотоэффекта, перемещаются под действием электрического поля к аноду А. Рис.3.11.4. В результате в цепи прибора течет фототок, измеряемый гальванометром G. Напряжение между анодом и катодом можно изменять с помощью потенциометра П. 66 Полученная на таком приборе вольтамперная характеристика (т. е. кривая зависимости фототока I от напряжения между электродами U) приведена на рис.3.11.5. Естественно, что характеристика снимается при неизменном потоке света Ф. Из этой кривой видно, что при некотором не очень большом напряжении фототок достигает насыщения — все электроны, испущенные катодом, попадают на анод. Рис.3.11.5. Следовательно, сила тока насыщения Iн определяется количеством электронов, испускаемых катодом в единицу времени под действием света. Пологий ход кривой указывает на то, что электроны вылетают из катода с различными по величине скоростями. Доля электронов, отвечающая силе тока при U = 0, обладает скоростями, достаточными для того, чтобы долететь до анода «самостоятельно», без помощи ускоряющего поля. Для обращения силы тока в нуль нужно приложить задерживающее напряжение U3 (потенциал катода выше потенциала анода). При таком напряжении ни одному из электронов, даже обладающему при вылете из катода наибольшим значением скорости Vm, не удается преодолеть задерживающее поле и достигнуть анода. Поэтому можно написать, что 1 mVm2 eU з , 2 (3.11.3) где m – масса электрона. Таким образом, измерив задерживающее напряжение Uз, можно определить максимальное значение скорости фотоэлектронов. К 1905 г. было выяснено, что максимальная скорость фотоэлектронов не зависит от интенсивности света, а зависит только от его частоты — увеличение частоты приводит к возрастанию скорости. Установленные экспериментально зависимости не укладываются в рамки классических представлений. Например, 1.скорость фотоэлектронов по классическим понятиям должна возрастать с амплитудой, а, следовательно, и с интенсивностью электромагнитной волны; 2.максимальное значение скорости должно наблюдаться при некотором значении частоты 0 ; уменьшение или увеличение частоты подаваемого излучения должно приводить к уменьшению скорости электронов. В 1905 г. А. Эйнштейн показал, что все закономерности фотоэффекта легко объясняются, если предположить, что свет поглощается такими же порциями ћω (квантами), какими он, по предположению Планка, испускается. По мысли Эйнштейна, энергия, полученная электроном, доставляется ему в виде кванта ћω, который усваивается им целиком. Часть этой энергии, равная работе выхода A, затрачивается на то, чтобы электрон мог покинуть тело (энергия электрона в веществе меньше его энергии снаружи). Если электрон освобождается светом не у самой поверхности, а на некоторой глубине, то часть энергии, равная E’, может быть потеряна вследствие случайных столкновений в веществе. Остаток энергии образует кинетическую энергию Eк электрона, покинувшего вещество. 67 Энергия Eк будет максимальна, если E’ = 0. В этом случае должно выполняться соотношение 1 mVm2 A, 2 (3.11.4) которое называется формулой Эйнштейна для фотоэффекта . Фотоэффект и работа выхода в сильной степени зависят от состояния поверхности металла (в частности, от находящихся на ней окислов и адсорбированных веществ). Поэтому долгое время не удавалось проверить формулу Эйнштейна с достаточной точностью. В 1916 г. Милликен создал прибор, в котором исследуемые поверхности подвергались очистке в вакууме, после чего измерялась работа выхода и исследовалась зависимость максимальной кинетической энергии фотоэлектронов от частоты света (эта энергия определялась путем измерения задерживающего потенциала UЗ). Результаты оказались в полном согласии с формулой (3.11.4). Подставив в формулу (3.11.4) измеренные значения A и ½mVm2 (при данной ω), Милликен определил значение постоянной Планка ћ, которое оказалось совпадающим со значениями, найденными из спектрального распределения равновесного теплового излучения и из коротковолновой границы тормозного рентгеновского спектра. Из формулы (3.11.4) вытекает, что в случае, когда работа выхода А превышает энергию кванта ћω, электроны не могут покинуть металл. Следовательно, для возникновения фотоэффекта необходимо выполнение условия ћω ≥ A, или (3.11.5) 0 A / . Соответственно для длины волны получается условие: 0 2c . A (3.11.6) Частота ω0 или длина волны λο называется красной границей фотоэффекта. Число высвобождаемых вследствие фотоэффекта электронов должно быть пропорционально числу падающих на поверхность квантов света. Вместе с тем световой поток Φ определяется количеством квантов света, падающих на поверхность в единицу времени. В соответствии с этим ток насыщения Iн должен быть пропорционален падающему световому потоку: Iн ~ Ф. Эта зависимость также подтверждается экспериментально. Заметим, что лишь малая часть квантов передает свою энергию фотоэлектронам. Энергия остальных квантов затрачивается на нагревание вещества, поглощающего свет. В рассмотренном выше явлении фотоэффекта электрон получает энергию от одного лишь фотона. Кроме рассмотренного нами в внешнего фотоэффекта (называемого обычно просто фотоэффектом), существует также внутренний фотоэффект, наблюдаемый в диэлектриках и полупроводниках. В этих веществах отсутствуют свободные электроны. Поэтому электрону, чтобы покинуть вещество, необходимо затратить больше энергии. Кроме работы выхода из вещества Ав ых ему нужно еще совершить работу для отрыва от атома Аион . Поэтому, если энергия фотона 68 Аион Аион Ав ых , то в веществе образуется лежит в интервале большое количество свободных электронов. Этот эффект используется в ряде приборов, получивших разнообразное применение в науке и технике. В частности, в применяемых для питания аппаратуры солнечных батареях. Фотоны. Чтобы объяснить распределение энергии в спектре равновесного теплового излучения, достаточно, как показал Планк, допустить, что свет только испускается порциями ћω. Для объяснения фотоэффекта достаточно предположить, что свет поглощается такими же порциями. Однако Эйнштейн пошел значительно дальше. Он выдвинул гипотезу, что свет и распространяется в виде дискретных частиц, названных первоначально световыми квантами. Впоследствии эти частицы получили название фотонов. Наиболее непосредственное подтверждение гипотезы Эйнштейна дал опыт Боте. Тонкая металлическая фольга Φ (рис.3.11.6) помещалась между двумя газоразрядными счетчиками Сч. Фольга освещалась слабым пучком рентгеновских лучей, под действием которых она сама становилась источником рентгеновских лучей (это явление называется рентгеновской флуоресценцией). Вследствие малой интенсивности первичного пучка количество квантов, испускаемых фольгой, было невелико. При попадании в него рентгеновских лучей счетчик срабатывал и приводил в действие особый механизм М, делавший отметку на Рис.3.11.6. движущейся ленте Л. Если бы излучаемая энергия распространялась равномерно во все стороны, как это следует из волновых представлений, оба счетчика должны были бы срабатывать одновременно и отметки на ленте приходились бы одна против другой. В действительности же наблюдалось совершенно беспорядочное расположение отметок. Это можно объяснить лишь тем, что в отдельных актах испускания возникают световые частицы, летящие то в одном, то в другом направлении. Итак, было экспериментально доказано существование особых световых частиц – фотонов. Энергия фотона определяется его частотой: (3.11.7) E . Электромагнитная волна обладает импульсом. Соответственно должен обладать импульсом и фотон. Чтобы определить импульс фотона, воспользуемся соотношениями теории относительности. Рассмотрим две системы отсчета К. и К.', движущиеся друг относительно друга со скоростью V 0 . Оси x и x' направим вдоль V0. Пусть в направлении этих осей летит фотон. Энергия фотона в системах К и К’ равна соответственно ћω и ћω’, Частоты ω и ω' связаны соотношением ' 1 V0 / c 1 V0 / c Следовательно, 69 2 . E' E 1 V0 / c 1 V0 / c 2 (3.11.8) . Обозначим импульс фотона в системе К символом р , в системе К' — симво лом р '. Из соображений симметрии следует, что импульс фотона должен быть направлен вдоль оси x. Поэтому рх = p, px’=p'· При переходе от одной системы отсчета к другой энергия и импульс преобразуются по формуле E' E V0 p x 1 V0 / c 2 (3.11.9) . В рассматриваемом нами случае можно заменить в (3.11.9) рx через р. Из сопоставления формул (3.11.9) и (3.11.8) следует, что V Е1 0 E V0 p c (мы написали p вместо рx)· Отсюда p E / c. c (3.11.10) Такое соотношение между импульсом и энергией возможно только для частиц с нулевой массой покоя, движущихся со скоростью с. Таким образом, из квантового соотношения Ε = ћω и общих принципов теории относительности вытекает, что 1) масса покоя фотона равна нулю, 2) фотон всегда движется со скоростью с. Сказанное означает, что фотон представляет собой частицу особого рода, отличную от таких частиц, как электрон, протон и т. п., которые могут существовать, двигаясь со скоростями, меньшими c, и даже покоясь. Заменив в формуле (3.11.10) частоту ω через длину волны λ, получим для импульса фотона выражение p 2 k , (3.11.11) (k — волновое число). Фотон летит в направлении распространения электромагнитной волны. Поэтому направления импульса p и волнового вектора k совпадают. Следовательно, формулу (3.11.11) можно написать в векторном виде: p k . (3.11.12) Пусть на поглощающую свет поверхность падает поток фотонов, летящих по нормали к поверхности. Если плотность фотонов равна n, на единицу поверхности падает в единицу времени nc фотонов. При поглощении каждый фотон сообщает стенке импульс p = Ε/с. Умножив p на nc, получим импульс, сообщаемый в единицу времени единице поверхности, т. е. давление P света на стенку: P=(E/c)nc=En. Произведение En равно энергии фотонов, заключенных в единице объема, т.е. плотности электромагнитной энергии w. Таким образом, мы пришли к формуле P=w, которая совпадает с выражением для давления, получающимся из 70 электромагнитной теории. Отражаясь от стенки, фотон сообщает ей импульс 2р. Поэтому для отражающей поверхности давление будет равно 2w. В данной лекции мы рассмотрели ряд явлений, в которых свет ведет себя как поток частиц (фотонов). Однако не надо забывать, что такие явления, как интерференция и дифракция света, могут быть объяснены только на основе волновых представлений. Таким образом, свет обнаруживает корпускулярноволновой дуализм (двойственность): в одних явлениях проявляется его волновая природа, и он ведет себя как электромагнитная волна, в других явлениях проявляется корпускулярная природа света, и он ведет себя как поток фотонов. В дальнейшем мы увидим, что корпускулярно-волновой дуализм присущ не только световым частицам, но и частицам вещества (электронам, протонам, атомам и т. д.). Лекция 3.12 Ядерная модель атома. Постулаты Бора. Спектральные закономерности. Изучение спектров излучения сыграло большую роль в познании строения атомов. В первую очередь это касается спектров, обусловленных излучением невзаимодействующих друг с другом атомов. Эти спектры состоят из отдельных узких спектральных линий, и их называют линейчатыми. Наличие многих спектральных линий указывает на сложность внутреннего строения атома. Изучение атомных спектров послужило ключом к познанию внутренней структуры атомов. Прежде всего, было замечено, что спектральные линии расположены не беспорядочно, а образуют серии линий. Изучая линейчатый спектр атомарного водорода, Бальмер (1885) установил некоторую закономерность. Для части линий соответствующие им частоты можно в современных обозначениях представить так: 1 1 R 2 2 , n 3, 4, 5, ..., (3.12.1) n 2 где — циклическая частота, соответствующая каждой спектральной линии ( = 2πc/), R — постоянная, называемая постоянной Ридберга: R = 2,07 1016 c-1. (3.12.2) Формулу (3.12.1) называют формулой Бальмера, а соответствующую серию спектральных линий — серией Бальмера (рис.3.12.1). Основные линии этой серии находятся в видимой части спектра. Дальнейшие исследования спектра атомарного водорода Рис.3.12.1. показали, что имеется еще несколько серий. В ультрафиолетовой части спектра — серия Лаймана: 1 1 R 2 2 , n 2, 3, 4, ..., (3.12.3) 1 n а в инфракрасной части спектра – серия Пашена: 71 1 1 , n 4, 5, 6, ..., 2 2 n 3 R (3.12.4) и так далее. Все эти серии можно представить в виде обобщенной формулы Бальмера: 1 1 R 2 2 , (3.12.5) n n 0 где п 0 - постоянное для каждой серии число: n0 = 1 для серии Лаймана, n0 = 2 для серии Бальмера и т. д. При заданном n0 число n принимает все целочисленные значения, начиная с n0 + 1. Максимальной длине волны серии Лаймана (3.12.3) отвечает n = 2, это макс = 2πс/мин = 8 с/3R = 121,6 нм. Соответствующую спектральную линию называют резонансной линией водорода. С ростом n частота линий в каждой серии стремится к предельному значению R / n02 , которое называют границей серии (рис.3.12.1). За границей серии спектр не обрывается, а становится сплошным. Это присуще не только всем сериям водорода, но и атомам других элементов. Таким образом, интересующая нас серия Бальмера заключена в спектральном интервале от 365 нм до 656 нм, т. е. действительно, все основные линии ее расположены в видимой области спектра. Опыты Резерфорда. Ядерная модель атома. Излучение электромагнитных волн возможно при ускоренном движении зарядов. Атом в целом электрически нейтрален. С другой стороны известно, что в состав атома входят отрицательно заряженные электроны. Следовательно, в его состав должны входить также положительно заряженные частицы. Принятую в настоящее время модель атома предложил Резерфорд, базируясь на результатах своих опытов по рассеянию - частиц. В этих опытах очень тонкая золотая фольга облучалась пучком - частиц с довольно большой энергией. – частицами называют один из видов частиц, испускаемых некоторыми веществами при радиоактивном распаде. В то время уже были известны масса – частицы ( т ) и ее положительный заряд, равный удвоенному элементарному заряду (модулю заряда электрона). Проходя сквозь фольгу, – частицы рассеивались атомами вещества, т.е. отклонялись на некоторый угол от первоначального направления. Регистрация рассеянных частиц осуществлялась по вспышкам света, возникающим при их ударе об экран, покрытый сернистым цинком. В результате опытов оказалось, что почти все - частицы проходили сквозь фольгу, отклоняясь на очень небольшие углы. Однако, было небольшое количество – частиц, которые отклонялись на очень большие углы (почти до 180 0 ). Проанализировав результаты опытов, Резерфорд пришел к выводу, что столь 72 сильное отклонение - частиц возможно при их взаимодействии с положительно заряженной частью атома, в которой сосредоточена его основная масса. Размеры этой части можно оценить, если предположить, что - частица, отбрасывается в обратном направлении после «упругого лобового столкновения» с положительно заряженной частью атома. Для этого нужно приравнять кинетическую энергию - частицы к потенциальной энергии ее взаимодействия с этой частью атома в момент остановки - частицы: тV 2 2eZe , (3.12.6) 2 rmin где V - скорость - частицы, 2е – ее заряд, Zе – заряд положительной части атома, rmin - минимальное расстояние, на которое - частица сможет приблизиться к положительной части атома (в атомной физике принято использовать Гауссову систему единиц). Положив в этом равенстве Z = 79 (золото), V=10 9 см с , т =4·1,66·10 24 г = 6,6·10 24 г, получим rmin ≈ 10 11 см. Напомним, что, изучая свойства газов с помощью методов кинетической теории, можно определить размеры атомов. Найденные таким способом размеры для всех атомов имеют порядок 10 8 см. Таким образом, размер положительной части атома оказался на несколько порядков меньше размера атома. На основании этих оценок Резерфорд предложил ядерную (или планетарную) модель атома. Весь положительный заряд и почти вся масса атома сосредоточены в его ядре, размер которого ≈ 10 11 см, пренебрежимо мал по сравнению с размером атома. Вокруг ядра движутся электроны, занимая огромную по сравнению с ядром область с линейным размером порядка 10 8 см. Однако, если принять эту модель, то становится непонятно, почему электроны не падают на ядро. Между электроном и ядром существует только кулоновская сила притяжения. Поэтому электрон не может покоиться. Он должен двигаться вокруг ядра. Но в этом случае, согласно законам классической физики, он должен излучать, причем на всех частотах, что противоречит опыту. Теряя энергию, электрон должен упасть на ядро (атом высветится). Оценки показали, что вся его энергия будет излучена за время порядка 10 8 с. Это и будет «время жизни» атома. Постулаты Бора. Абсолютная неустойчивость планетарной модели Резерфорда и вместе с тем удивительная закономерность атомных спектров, и в частности их дискретность, привели Н.Бора к необходимости сформулировать (1913) два важнейших постулата квантовой физики: 1. Атом может длительное время находиться только в определенных, так называемых стационарных состояниях, которые характеризуются дискретными значениями энергии Е1, Е2, Е3, … В этих состояниях, вопреки классической электродинамике, атом не излучает. 73 2. При переходе атома из стационарного состояния с большей энергией Е2 в стационарное состояние с меньшей энергией Е1 происходит излучение кванта света (фотона) с энергией ћ: Е2 Е1. (3.12.7) Такое же соотношение выполняется и в случае поглощения, когда падающий фотон переводит атом с низшего энергетического уровня Е1 на более высокий Е2, а сам исчезает. Соотношение (3.12.7) называют правилом частот Бора. Заметим, что переходы атома на более высокие энергетические уровни могут быть обусловлены и столкновением с другими атомами. Таким образом, атом переходит из одного стационарного состояния в другое скачками (их называют квантовыми). Что происходит с атомом в процессе перехода этот вопрос в теории Бора остается открытым. Опыты Франка и Герца. Эти опыты, проведенные в 1913г. дали прямое доказательство дискретности атомных состояний. Идея опытов заключается в следующем. При неупругих столкновениях электрона с атомом происходит передача энергии от электрона атому. Если внутренняя энергия атома изменяется непрерывно, то атому может быть передана любая порция энергии. Если же состояния атома дискретны, то его внутренняя энергия при столкновении с электроном должна изменяться также дискретно — на значения, равные разности внутренней энергии атома в стационарных состояниях. Следовательно, при неупругом столкновении электрон может передать атому лишь определенные порции энергии. Измеряя их, можно определить значения внутренних энергий стационарных состояний атома. Это и предстояло проверить экспериментально с помощью установки, схема которой показана на рис3.12.2. В баллоне с парами ртути под давлением порядка 1 мм рт.ст. (130 Па) имелись три электрода: К — катод, С — сетка и А — анод. Электроны, испускаемые горячим катодом вследствие термоэлектронной эмиссии, ускорялись разностью потенциалов V между катодом и сеткой. Величину V можно было плавно менять. Рис.3.12.2. Между сеткой и анодом создавалось слабое тормозящее поле с разностью потенциалов около 0,5 В. Таким образом, если какой-то электрон проходит сквозь сетку с энергией, меньшей 0,5 эВ, то он не долетит до анода. Только те электроны, энергия которых при прохождении сетки больше 0,5 эВ, попадут на анод, образуя анодный ток I, доступный измерению. В опытах (рис.3.12.3) исследовалась зависимость анодного тока I (гальванометром G) от ускоряющего напряжения V (вольтметром V). Полученные результаты представлены на графике. Максимумы соответствуют значениям энергии Е1 = 4,9 эВ, Е2 = 2 Е1, Рис.3.12.3 Е3 = 3Е1 и т. д. 74 Такой вид кривой объясняется тем, что атомы действительно могут поглощать лишь дискретные порции энергии, равные 4,9 эВ. При энергии электронов, меньшей 4,9 эВ, их столкновения с атомами ртути могут быть только упругими (без изменения внутренней энергии атомов), и электроны достигают сетки с энергией, достаточной для преодоления тормозящей разности потенциалов между сеткой и анодом. Когда же ускоряющее напряжение V становится равным 4,9 эВ, электроны начинают испытывать вблизи сетки неупругие столкновения, отдавая атомам ртути всю энергию, и уже не смогут преодолеть тормозящую разность потенциалов в пространстве за сеткой. Значит, на анод А могут попасть только те электроны, которые не испытали неупругого столкновения. Поэтому, начиная с ускоряющего напряжения 4,9 В анодный ток I будет уменьшаться. При дальнейшем росте ускоряющего напряжения достаточное число электронов после неупругого столкновения успевает приобрести энергию, необходимую для преодоления тормозящего поля за сеткой. Начинается новое возрастание силы тока I. Когда ускоряющее напряжение увеличится до 9,8 В, электроны после одного неупругого столкновения (примерно на середине пути, когда они успевают набрать энергию 4,9эВ) достигают сетки с энергией 4,9 эВ, достаточной для второго неупругого столкновения. При втором неупругом столкновении электроны теряют всю свою энергию и не достигают анода. Поэтому анодный ток I начинает опять уменьшаться (второй максимум на графике). Аналогично объясняются и последующие максимумы. Из результатов опытов следует, что разница внутренних энергий основного состояния атома ртути и ближайшего возбужденного состояния равна 4,9 эВ, что и доказывает дискретность внутренней энергии атома. Аналогичные опыты были проведены в дальнейшем с атомами других газов. И для них были получены характерные разности потенциалов, их называют резонансными потенциалами или первыми потенциалами возбуждения. Резонансный потенциал соответствует переходу атома с основного состояния (с минимальной энергией) в ближайшее возбужденное. Для обнаружения более высоких возбужденных состояний была использована более совершенная методика, однако принцип исследования оставался тем же. Итак, все опыты такого рода приводят к заключению, что состояния атомов изменяются лишь дискретно. Опыты Франка и Герца подтверждают также и второй постулат Бора — правило частот. Оказывается, что при достижении ускоряющего напряжения 4,9В пары ртути начинают испускать ультрафиолетовое излучение с длиной волны 253,7 нм. Это излучение связано с переходом атомов ртути из первого возбужденного состояния в основное. Действительно, из условия (13.2.7) следует, что Этот результат хорошо согласуется с предыдущими измерениями. 75 Боровская модель атома водорода. Чтобы получить согласие с результатами наблюдений, Бор предположил, что электрон в атоме водорода движется только по тем круговым орбитам, для которых его момент импульса (3.12.8) M mr n, n 1, 2, 3, ... , где n — квантовые числа, т – масса электрона, - его скорость, r - радиус орбиты. (Рассуждения, которые привели Бора к этому предположению мы опустим.) С помощью этого правила квантования можно найти радиусы круговых стационарных орбит водорода и водородоподобных систем: ионов атомов с одним оставшимся электроном (Н, Не+, Li + +, …) и соответствующие им энергии. Пусть заряд ядра водородоподобной системы равен e. Масса ядра значительно больше массы электрона, поэтому ядро при движении электрона можно считать неподвижным. Следуя Бору, будем предполагать, что электрон движется вокруг ядра по окружности радиуса r. Согласно 2-му закону Ньютона 2 Ze 2 m 2 , (3.12.9) r r Решая совместно (3.12.8) и (3.12.9), можно найти радиусы электронных орбит и их скорости на этих орбитах: 2 2 Ze 2 1 rn n ; . (3.12.10) n mZe2 n Таким образом, радиус первой (ближайшей к ядру) орбиты электрона в атоме водорода (его обозначают обычно r0 и называют первым Боровским радиусом) 2 r0 5,29 нм (3.12.11) me 2 Внутренняя энергия атома складывается из кинетической энергии электрона (ядро полагают неподвижным) и потенциальной энергии взаимодействия электрона с ядром. С учетом (3.12.10) получим: m 2n Ze 2 mZ 2 e 4 1 En . (3.12.12) 2 2 2 r 2 n n При переходе атома водорода (Z =1) из состояния п1 в состояние п 2 излучается фотон те 4 1 1 Е п Е п 2 2 2 . (3.12.13) 2 п1 п2 Тогда частота испущенного света равна те4 1 1 3 2 2 , (3.12.14) 2 п2 п1 Что соответствует обобщенной формуле Бальмера, если постоянная Ридберга me4 R 3 . определяется (3.12.15) 2 1 2 76 Расчет по этой формуле хорошо согласуется с экспериментально определенным значением. Схема энергетических уровней (разрешенных значений энергии) атома водорода приведена на рис.3.12.4. Там же показаны возможные переходы, сопровождающиеся излучением фотонов определенной частоты. Рис.3.12.4. Лекция 3.13. Волновые свойства частиц вещества. Гипотеза де-Бройля. Волны де-Бройля. Как было сказано ранее, свет (и вообще излучение) имеет двойственную природу: в одних явлениях (интерференция, дифракция и др.) свет проявляет себя как волны, в других явлениях с не меньшей убедительностью – как частицы. Это и побудило де-Бройля (в 1923 г.) высказать идею о том, что материальные частицы должны обладать и волновыми свойствами, т.е. распространить подобный корпускулярно-волновой дуализм на частицы с массой покоя, отличной от нуля. Если с такой частицей связана какая-то волна, можно ожидать, что она распространяется в направлении скорости υ частицы. О природе этой волны ничего определенного де-Бройлем не было высказало. Не будем и мы пока выяснять их природу, хотя сразу же подчеркнем, что эти волны не электромагнитные. Они имеют, как мы увидим далее, специфическую природу, для которой нет аналога в классической физике. Итак, де-Бройль высказал гипотезу, что соотношение для импульса p=ћω/c, относящееся к фотонам, имеет универсальный характер, т. е. частицам можно сопоставить волну, длина которой (3.13.1) Эта формула получила название формулы де-Бройля, а λ – дебройлевской длины волны частицы с импульсом р. Де-Бройль также предположил, что пучок частиц, падающих на двойную щель, должен за ними интерферировать. 77 Вторым, независимым от формулы (3.13.1), соотношением является связь между энергией Е частицы и частотой ω дебройлевской волны: (3.13.2) В принципе энергия Е определена всегда с точностью до прибавления произвольной постоянной (в отличие от ΔЕ), следовательно, частота ω является принципиально ненаблюдаемой величиной (в отличие от дебройлевской длины волны). С частотой ω и волновым числом k связаны две скорости — фазовая υф и групповая u: (3.13.3) Умножив числитель и знаменатель обоих выражений на ћ с учетом (3.13.1) и (3.13.2), получим, ограничившись рассмотрением только нерелятивистского случая, т.е. полагая E = p2/2m (кинетическая энергия): (3.13.4) Отсюда видно, что групповая скорость равна скорости частицы, т. е. является принципиально наблюдаемой величиной, в отличие от υф - из-за неоднозначности Е. Из первой формулы (3.13.4) следует, что фазовая скорость дебройлевских волн (3.13.5) т. е. зависит от частоты ω, а значит дебройлевские волны обладают дисперсией даже в вакууме. Далее будет показано, что в соответствии с современной физической интерпретацией фазовая скорость дебройлевских волн имеет чисто символическое значение, поскольку эта интерпретация относит их к числу принципиально ненаблюдаемых величин. Впрочем, сказанное видно и сразу, так как Е в (3.13.5) определена, как уже говорилось, с точностью до прибавления произвольной постоянной. Установление того факта, что согласно (3.13.4) групповая скорость дебройлевских волн равна скорости частицы, сыграло в свое время важную роль в развитии принципиальных основ квантовой физики, и в первую очередь в физической интерпретации дебройлевских волн. Сначала была сделана попытка рассматривать частицы как волновые пакеты весьма малой протяженности и таким образом решить парадокс двойственности свойств частиц. Однако подобная интерпретация оказалась ошибочной, так как все составляющие пакет гармонические волны распространяются с разными фазовыми скоростями. При наличии большой дисперсии, свойственной дебройлевским волнам даже в вакууме, волновой пакет «расплывается». Для частиц с массой порядка массы электрона пакет расплывается практически мгновенно, в то время как частица является стабильным образованием. 78 Таким образом, представление частицы в виде волнового пакета оказалось несостоятельным. Проблема двойственности свойств частиц требовала иного подхода к своему решению. Вернемся к гипотезе де-Бройля. Выясним, в каких явлениях могут проявиться волновые свойства частиц, если они, эти свойства, действительно существуют. Мы знаем, что независимо от физической природы волн — это интерференция и дифракция. Непосредственно наблюдаемой величиной в них является длина волны. Во всех случаях дебройлевская длина волны определяется формулой (3.13.1). Проведем с помощью нее некоторые оценки. Прежде всего, убедимся, что гипотеза де-Бройля не противоречит понятиям макроскопической физики. Возьмем в качестве макроскопического объекта, например, пылинку, считая, что ее масса m = 1мг и скорость V = 1 мкм/с. Соответствующая ей дебройлевская длина волны (3.13.6) Т. е. даже у такого небольшого макроскопического объекта как пылинка дебройлевская длина волны оказывается неизмеримо меньше размеров самого объекта. В таких условиях никакие волновые свойства, конечно, проявить себя не могут в условиях доступных измерению размеров. Иначе обстоит дело, например, у электрона с кинетической энергией K и импульсом p 2mK . Его дебройлевская длина волны (3.13.7) где K должно быть измерено в электрон-вольтах (эВ). При K = 150 эВ дебройлевская длина волны электрона равна согласно (3.13.7) λ = 0,1нм. Такой же порядок величины имеет постоянная кристаллической решетки. Поэтому, аналогично тому, как в случае рентгеновских лучей, кристаллическая структура может быть подходящей решеткой для получения дифракции дебройлевских волн электронов. Однако гипотеза де-Бройля представлялась настолько нереальной, что довольно долго не подвергалась экспериментальной проверке. Экспериментально гипотеза де-Бройля была подтверждена в опытах Дэвиссона и Джермера (1927г.). Идея их опытов заключалась в следующем. Если пучок электронов обладает волновыми свойствами, то можно ожидать, даже не зная механизма отражения этих волн, что их отражение от кристалла будет иметь такой же интерференционный характер, как у рентгеновских лучей. В одной серии опытов Дэвиссона и Джермера для обнаружения дифракционных максимумов (если таковые есть) измерялись ускоряющее напряжение электронов и одновременно положение детектора D (счетчика отраженных электронов). В опыте использовался монокристалл никеля (кубической системы), сошлифованный так, как показано на рис.3.13. Если его повернуть вокруг вертикальной оси в Рис.3.13.1 79 положение, соответствующее рисунку, то в этом положении сошлифованная поверхность покрыта правильными рядами атомов, перпендикулярными к плоскости падения (плоскости рисунка), расстояние между которыми d = 0,215нм. Детектор перемещали в плоскости падения, меняя угол θ. При угле θ = 500 и ускоряющем напряжении V = 54B наблюдался особенно отчётливый максимум отраженных Рис.3.13.2. электронов, полярная диаграмма которых показала на рис.3.13.2.Этот максимум можно истолковать как интерференционный максимум первого порядка от плоской дифракционной решетки с указанным выше периодом в соответствии с формулой (3.13.8) что видно из рис.3.13.3. На этом рисунке каждая жирная точка представляет собой проекцию цепочки атомов, расположенных на прямой, перпендикулярной плоскости рисунка. Период d может быть измерен независимо, например, по дифракции рентгеновских лучей. Рис.3.13.3. Вычисленная по формуле (3.13.7) дебройлевская длина волны для V = 54B равна 0,167нм. Соответствующая же длина волны, найденная из формулы (3.13.8), равна 0,165нм. Совпадение настолько хорошее, что полученный результат следует признать убедительным подтверждением гипотезы де-Бройля. Другими опытами, подтверждающим гипотезу де-Бройля, были опыты Томсона и Тартаковского. В этих опытах пучок электронов пропускался через поликристаллическую фольгу (по методу Дебая при изучении дифракции рентгеновского излучения). Как и в случае рентгеновского излучения, на фотопластинке, расположенной за фольгой, наблюдалась система дифракционных колец. Сходство обеих картин поразительно. Подозрение, что система этих колец порождается не электронами, а вторичным рентгеновским излучением, возникающим в результате падения электронов на фольгу, легко рассеивается, если на пути рассеянных электронов создать магнитное поле (поднести постоянный магнит). Оно не влияет на рентгеновское излучение. Такого рода проверка показала, что интерференционная картина сразу же искажалась. Это однозначно свидетельствует, что мы имеем дело именно с электронами. Г. Томсон осуществил опыты с быстрыми электронами (десятки кэВ), П.С. Тарковский — со сравнительно медленными электронами (до 1,7 кэВ). Для успешного наблюдения дифракции волн на кристаллах необходимо, чтобы длина волны этих волн была сравнима с расстояниями между узлами кристаллической решетки. Поэтому для наблюдения дифракции тяжелых частиц необходимо пользоваться частицами с достаточно малыми скоростями. Соответствующие опыты по дифракции нейтронов и молекул при отражении от кристаллов были проделаны и также полностью подтвердили гипотезу деБройля в применении и к тяжелым частицам. Благодаря этому было экспериментально доказано, что волновые свойства являются универсальным свойством всех частиц. Они не обусловлены какими80 то особенностями внутреннего строения той или иной частицы, а отражают их общий закон движения. Описанные выше опыты выполнялись с использованием пучков частиц. Поэтому возникает естественный вопрос: наблюдаемые волновые свойства выражают свойства пучка частиц или отдельных частиц? Чтобы ответить на этот вопрос, В. Фабрикант, Л. Биберман и Н. Сушкин осуществили в 1949 г. опыты, в которых применялись столь слабые пучки электронов, что каждый электрон проходил через кристалл заведомо поодиночке, и каждый рассеянный электрон регистрировался фотопластинкой. При этом оказалось, что отдельные электроны попадали в различные точки фотопластинки совершенно беспорядочным на первый взгляд образом (рис.3.13.4а). Между тем при достаточно длительной экспозиции на фотопластинке возникала дифракционная картина (рис.3.13.4б), абсолютно идентичная картине дифракции от обычного электронного пучка. Так было доказано, что волновыми свойствами обладают и отдельные частицы. Таким образом, мы имеем дело с микрообъектами, которые обладают одновременно как корпускулярными, так и волновыми свойствами. Это позволяет нам в дальнейшем говорить об электронах, но выводы, к которым мы придем, имеют Рис.3.13.4. общий смысл и в равной степени применимы к любым частицам. Парадоксальное поведение микрочастиц. Рассмотренные в предыдущем параграфе эксперименты вынуждают констатировать, что перед нами один из загадочнейших парадоксов: что означает утверждение «электрон — это одновременно частица и волна»? Попытаемся разобраться в этом вопросе с помощью мысленного эксперимента, аналогичного опыту Юнга по изучению интерференции света (фотонов) от двух щелей. После прохождения пучка электронов через две щели на экране образуется система максимумов и минимумов, положение которых можно рассчитать по формулам волновой оптики, если каждому электрону сопоставить дебройлевскую волну. В явлении интерференции от двух щелей таятся сама суть квантовой теории, поэтому уделим этому вопросу особое внимание. Если мы имеем дело с фотонами, то парадокс (частица — волна) можно устранить, предположив, что фотон в силу своей специфичности расщепляется на две части (на щелях), которые затем интерферируют. А электроны? Они ведь никогда не расщепляются — это установлено совершенно достоверно. Электрон может пройти либо через щель 1, либо через щель 2 (рис.3.13.5). Следовательно, распределение их на экране Э должно быть суммой распределений 1 и 2 (рис.3.13.5а) — оно показано пунктирной кривой. Рис.13.13.5. 81 Хотя логика в этих рассуждениях безупречна, такое распределение не осуществляется. Вместо этого мы наблюдаем совершенно иное распределение (рис.3.13.5б). Не есть ли это крушение чистой логики и здравого смысла? Ведь все выглядит так, как если бы 100 + 100 = 0 (в точке P). В самом деле, когда открыта или щель 1 или щель 2, то в точку P приходит, скажем, по 100 электронов в секунду, а если открыты обе щели, то ни одного!.. Более того, если сначала открыть щель 1, а потом постепенно открывать щель 2, увеличивая ее ширину, то по здравому смыслу число электронов, приходящих в точку P ежесекундно, должно расти от 100 до 200. В действительности же — от 100 до нуля. Если подобную процедуру повторить, регистрируя частицы, например, в точке O (см. рис.3.13.5б), то возникает не менее парадоксальный результат. По мере открывания щели 2 (при открытой щели 1) число частиц в точке O растет не до 200 в секунду, как следовало бы ожидать, а до 400! Как открывание щели 2 может повлиять на электроны, которые, казалось бы, проходят через щель 1? Т. е. дело обстоит так, что каждый электрон, проходя через какую-то щель, «чувствует» и соседнюю щель, корректируя свое поведение. Или подобно волне проходит сразу через обе щели (!?). Ведь иначе интерференционная картина не может возникнуть. Попытка все же определить, через какую щель проходит тот или иной электрон, приводит к разрушению интерференционной картины, но это уже совсем другой вопрос. Какой же вывод? Единственный способ «объяснения», этих парадоксальных результатов заключается в создании математического формализма, совместимого с полученными результатами и всегда правильно предсказывающего наблюдаемые явления. Причем, разумеется, этот формализм должен быть внутренне непротиворечивым. И такой формализм был создан. Он ставит в соответствие каждой частице некоторую комплексную пси-функцию Ψ(r, t). Формально она обладает свойствами классических волн, поэтому ее часто называют волновой функцией. Поведение свободной равномерно движущейся в определенном направлении частицы описывает плоская волна де-Бройля Ае i kr t (3.13.9) Но более подробно об этой функции, ее физическом смысле и уравнении, которое управляет ее поведением в пространстве и времени, речь пойдет в следующей лекции. Возвращаясь к поведению электронов при прохождении через две щели, мы должны признать: тот факт, что в принципе нельзя ответить на вопрос, через какую щель проходит электрон (не разрушая интерференционной картины), несовместим с представлением о траектории. Таким образом, электронам, вообще говоря, нельзя приписать траектории. Однако при определенных условиях, а именно когда дебройлевская длина волны микрочастицы становится очень малой и может оказаться много меньше, например, расстояния между щелями или атомных размеров, понятие траекто82 рии снова приобретает смысл. Рассмотрим этот вопрос более подробно и сформулируем более корректно условия, при которых можно пользоваться классической теорией. Принцип неопределенности В классической физике исчерпывающее описание состояния частицы определяется динамическими параметрами, такими как координаты, импульс, момент импульса, энергия и др. Однако реальное поведение микрочастиц показывает, что существует принципиальный предел точности, с которой подобные переменные могут быть указаны и измерены. Глубокий анализ причин существования этого предела, который называют принципом неопределенности, провел В. Гейзенберг (1927г.). Количественные соотношения, выражающие этот принцип в конкретных случаях, называют соотношениями неопределенностей. Своеобразие свойств микрочастиц проявляется в том, что не для всех переменных получаются при измерениях определенные значения. Существуют пары величин, которые не могут быть одновременно определены точно. Наиболее важными являются два соотношения неопределенностей. Первое из них ограничивает точности одновременного измерения координат и соответствующих проекций импульса частицы. Для проекции, например, на ось х оно выглядит так: (3.13.10) Второе соотношение устанавливает неопределенность измерения энергии, ΔE, за данный промежуток времени Δt: (3.13.11) Поясним смысл этих двух соотношений. Первое из них утверждает, что если положение частицы, например, по оси х известно с неопределенностью Δx, то в тот же момент проекцию импульса частицы на эту же ось можно измерить только с неопределенностью Δp= ћ/Δx. Заметим, что эти ограничения не касаются одновременного измерения координаты частицы по одной оси и проекции импульса — по другой: величины x и py, y и px и т. д. могут иметь одновременно точные значения. Согласно второму соотношению (3.13.11) для измерения энергии с погрешностью ΔЕ необходимо время, не меньшее, чем Δt=ћ/ΔE. Примером может служить «размытие» энергетических уровней водородоподобных систем (кроме основного состояния). Это связано с тем, что время жизни во всех возбужденных состояниях этих систем порядка 10-8 с. Размытие же уровней приводит к уширению спектральных линий (естественное уширение), которое действительно наблюдается. Сказанное относится и к любой нестабильной системе. Если время жизни ее до распада порядка τ, то из-за конечности этого времени энергия системы имеет неустранимую неопределенность, не меньшую, чем ΔE≈ ћ/τ. Укажем еще пары величин, которые не могут быть одновременно точно определены. Это любые две проекции момента импульса частицы. Поэтому не 83 существует состояния, в котором бы все три и даже какие-либо две из трех проекций момента импульса имели определенные значения. Обсудим более подробно смысл и возможности соотношения Δx·Δpx≥ћ. Прежде всего, обратим внимание на то, что оно определяет принципиальный предел неопределенностей Δx и Δpx , с которыми состояние частицы можно характеризовать классически, т.е. координатой x и проекцией импульса px. Чем точнее x, тем с меньшей точностью, возможно установить px, и наоборот. Подчеркнем, что истинный смысл соотношения (3.13.10) отражает тот факт, что в природе объективно не существует состояний частицы с точно определенными значениями обеих переменных, x и pх. Вместе с тем мы вынуждены, поскольку измерения проводятся с помощью макроскопических приборов, приписывать частицам не свойственные им классические переменные. Издержки такого подхода и выражают соотношения неопределенностей. После того, как выяснилась необходимость описывать поведение частиц волновыми функциями, соотношения неопределенностей возникают естественным образом — как математическое следствие теории. Считая соотношение неопределенностей (3.13.10) универсальным, оценим, как бы оно сказалось на движении макроскопического тела. Возьмем очень маленький шарик массы m = 1мг. Определим, например, с помощью микроскопа его положение с погрешностью Δx≈ 10-5см (она обусловлена разрешающей способностью микроскопа). Тогда неопределенность скорости шарика Δυ = Δp/m≈ (ћ/Δx)/m ~ 10-19см/с. Такая величина недоступна никакому измерению, а потому и отступление от классического описания совершенно несущественно. Другими словами, даже для такого маленького (но макроскопического) шарика понятие траектории применимо с высокой степенью точности. Иначе ведет себя электрон в атоме. Грубая оценка показывает, что неопределенность скорости электрона, движущегося по боровской орбите атома водорода, сравнима с самой скоростью: Δυ ≈ υ. При таком положении представление о движении электрона по классической орбите теряет всякий смысл. И вообще, при движении микрочастиц в очень малых областях пространства понятие траектории оказывается несостоятельным. Вместе с тем, при определенных условиях движение даже микрочастиц может рассматриваться классически, т. е. как движение по траектории. Так происходит, например, при движении заряженных частиц в электромагнитных полях (в электронно-лучевых трубках, ускорителях и др.). Эти движения можно рассматривать классически, поскольку для них ограничения, обусловленные соотношением неопределенностей, пренебрежимо малы по сравнению с самими величинами (координатами и импульсом). Опыт со щелью. Соотношение неопределенностей (3.13.10) проявляет себя при любой попытке точного измерения положения или импульса микрочастицы. И каждый раз мы приходим к «неутешительному» результату: уточнение положения частицы приводит к увеличению неопределенности импульса, и наоборот. В качестве иллюстрации такой ситуации рассмотрим следующий пример. Попытаемся определить координату x свободно движущейся с импульсом p частицы, поставив на ее пути перпендикулярно направлению движения экран со 84 щелью шириной b (рис.3.13.6). До прохождения частицы через щель ее проекция импульса pх имеет точное значение: px = 0. Это значит, что Δ px = 0, но координата x частицы является совершенно неопреде ленной согласно (3.13.10): мы не можем сказать, Рис.3.13.6. пройдет ли данная частица через щель. Если частица пройдет сквозь щель, то в плоскости щели координата x будет зарегистрирована с неопределенностью Δx ≈ b. При этом вследствие дифракции с наибольшей вероятностью частица будет двигаться в пределах угла 2θ, где θ — угол, соответствующий первому дифракционному минимуму. Он определяется условием, при котором разность хода волн от обоих краев щели будет равна λ (это доказывается в волновой оптике): В результате дифракции возникает неопределенность значения pх — проекции импульса, разброс которого Учитывая, что b ≈ Δх и p = 2πћ/λ., получим из двух предыдущих выражений: что согласуется по порядку величины с (3.13.10). Таким образом, попытка определить координату x частицы, действительно, привела к появлению неопределенности Δp в импульсе частицы. Анализ многих ситуаций, связанных с измерениями, показывает, что измерения в квантовой области принципиально отличаются от классических измерений. В отличие от последних, в квантовой физике существует естественный предел точности измерений. Он в самой природе квантовых объектов и не может быть преодолен никаким совершенствованием приборов и методов измерений. Соотношение (3.13.10) и устанавливает один из таких пределов. Взаимодействие между микрочастицей и макроскопическим измерительным прибором нельзя сделать сколь угодно малым. Измерение, например координаты частицы, неизбежно приводит к принципиально неустранимому и неконтролируемому искажению состояния микрочастицы, а значит и к неопределенности в значении импульса. Некоторые выводы. Соотношение неопределенностей (3.13.10) является одним из фундаментальных положений квантовой теории. Одного этого соотношения достаточно, чтобы получить ряд важных результатов, в частности: 1. Невозможно состояние, в котором частица находилась бы в состоянии покоя. 2. При рассмотрении движения квантового объекта необходимо во многих случаях отказаться от самого понятия классической траектории. 3. Часто теряет смысл деление полной энергии E частицы (как квантового объекта) на потенциальную U и кинетическую K. В самом деле, первая, т. е. U, зависит от координат, а вторая — от импульса. Эти же динамические переменные не могут иметь одновременно определенного значения. 85 Лекция 3.14. Уравнение Шрёдингера. Квантование энергии и момента импульса. Атом водорода. Волновая функция. Уравнение Шрёдингера. В развитие идеи де-Бройля о волновых свойствах вещества Э.Шрёдингер получил в 1926г. свое знаменитое уравнение. Он сопоставил движению микрочастицы комплексную функцию координат и времени, которую назвал волновой функцией и обозначил греческой буквой . Поэтому ее называют также псифункцией. Она характеризует состояние микрочастицы. Физический смысл водновой функции состоит в следующем: квадрат ее модуля определяет вероятность нахождения частицы в промежутке между точками х и х+dх в 2 момент времени t. Точнее величина r ,t является плотностью вероятности или плотностью распределения координат частицы. Из такого определения следуют свойства волновой функции. Она должна быть однозначной, непрерывной, гладкой (производная не терпит разрыва), конечной. Кроме того, она должна подчиняться условию нормировки 2 dV 1 . Основная задача физики микрочастиц (волновой или квантовой механики) как раз и состоит в нахождении волновых функций и связанных с ними физических следствий в самых разнообразных условиях. Для ее решения служит волновое уравнение Шрёдингера – основное уравнение нерелятивистской квантовой механики. (Заметим, что одним из решений этого уравнения в свободном пространстве должна быть плоская волна де-Бройля (3.13.9).) Особое значение в квантовой механике имеют стационарные состояния. Это такие состояния, в которых все наблюдаемые физические параметры не меняются с течением времени. Оказывается, что в стационарных состояниях r , t r e it , (3.14.1) где частота постоянна, а функция r не зависит от времени. Эта независящая от времени часть волновой функции может быть найдена из уравнения Шрёдингера для стационарных состояний 2 2 2 2 (3.14.2) 2 2 2 U r E , 2m x y z где т - масса частицы, Е – ее энергия, U r - функция, которая в случае стационарных состояний имеет смысл потенциальной энергии частицы. Энергия частицы Е входит в уравнение в качестве параметра. В теории дифференциальных уравнений доказывается, что уравнения вида (3.14.2) имеют решения, удовлетворяющие стандартным условиям, не при любых значениях параметра Е, а лишь при некоторых избранных значениях. Эти избранные значения называются собственными значениями энергии. Решения (значения волновой функции), соответствующие собственным значениям Е, называются собственными функциями. Совокупность собственных значений называется спектром величины (энергии). Если эта совокупность образует дискретную 86 последовательность, спектр называется дискретным, если же – непрерывную последовательность, спектр непрерывный или сплошной. Таким образом, из основных положений квантовой механики без каких-либо дополнительных предположений следует квантование (дискретность) энергии. Частица в бесконечно глубокой потенциальной яме. Рассмотрим квантование энергии на простейшем примере движения частицы, находящейся в бесконечно глубокой одномерной потенциальной яме. Пусть частица может двигаться только вдоль оси х, где движение ограничено непроницаемыми для частицы стенками: х = 0 и х = l. Потенциальная энергия рана нулю при 0≤ х ≤ l и обращается в бесконечность при х < 0 и x > l . Поскольку волновая функция в этом случае будет зависеть только от х, уравнение Шрёдингера будет иметь вид d 2 2m 2 E U 0 . (3.14.3) dx 2 За пределы потенциальной ямы частица попасть не может. Поэтому вероятность обнаружить там частицу, а, следовательно, и волновая функция в этих областях равна нулю. Из условия непрерывности следует, что и на границах ямы она равна нулю (3.14.4) 0 l 0 . В области, где не равна тождественно нулю, уравнение (3.14.3) примет d 2 2m 2 E 0 . вид (3.14.5) dx 2 2m Введя обозначение (3.14.6) k2 2 E, d 2 k 2 0 , получим уравнение (3.14.7) 2 dx решение которого будет иметь вид (3.14.8) х Аsin kx . Из первой части условия (3.14.4) следует 0 . Вторая часть этого условия l A sin kl 0 Будет выполнена лишь в случае, если kl n (n=1,2,3,…), (3.14.9) откуда, приняв во внимание (3.14.6), найдем собственные значения энергии 2 2 2 En n частицы (п=1,2,3,…). (3.14.10) 2ml 2 Спектр энергии оказался дискретным. Оценим «расстояния» между соседними уровнями. Разность энергий между двумя соседними уровнями равна 2 2 2 2 2n 1 2 n . Еп Е п 1 Еп (3.14.11) 2тl 2 ml 87 Если оценить эту величину для молекулы газа в сосуде (т ~ 10 26 кг, l ~ 10cм), получим Еп 10 25 п Дж 10 20 п эВ. Столь густо расположенные энергетические уровни будут практически восприниматься как сплошной спектр энергии, так что, хотя квантование энергии в принципе будет иметь место, на характере движения молекул это сказываться не будет. Аналогичный результат получим, если рассмотреть поведение свободных электронов в металле (те же размеры ямы, т ~ 10 30 кг, Еп 10 21 п Дж 10 16 п эВ). Однако, совсем другой результат получится для электрона, если область, в пределах которой он может двигаться, будет порядка атомных размеров (~ 10 10 м). В этом случае Еп 10 3 п Дж 10 2 п эВ, так что дискретность энергетических уровней будет весьма заметна. Атом водорода. Рассмотрим систему, называемую водородоподобным атомом, состоящую из неподвижного ядра с зарядом Ze и движущегося вокруг него электрона (при Z=1 – это атом водорода). Потенциальная энергия электрона представляет собой в этом случае сферически симметричную функцию Ze 2 U . (3.14.12) r Такой случай не предусматривался теорией Бора. В ней движение электрона вокруг ядра происходило по плоским орбитам. Но в квантовой механике, в которой нет представления о движении электронов по орбитам, нет препятствий для реализации сферически симметричных состояний атома. Поэтому уравнение Шрёдингера целесообразно записать в сферической системе координат: r, , . Решая это уравнение, получим, что собственные значения энергии могут принимать 1)любые положительные значения 2) дискретные отрицательные значетZ 2 e 4 1 Еп ния, равные (п=1,2,3,…). (3.14.13) 2 2 n 2 Случай Е > 0 соответствует электрону, пролетающему вблизи ядра и удаляющемуся на бесконечность. Случай Е < 0 - электрону, связанному с ядром. Заметим, что полученное выражение (3.14.13) совпадает с соответствующей формулой теории Бора (3.12.12). Однако в квантовой механике эти значения получаются из решения основного уравнения без введения каких-либо дополнительных предположений. Собственные функции уравнения Шрёдингера оказываются от трех целочисленных параметров, которые принято обозначать п, l, т, и распадаются на два множителя, один из которых зависит только от r, другой – от углов , nlm Rnl r Ylm , . (3.14.14) Параметры п, , т называются квантовыми числами. Параметр п называется главным квантовым числом и совпадает с номером уровня энергии в (3.14.13). 88 Параметр l называется азимутальным (или орбитальным) квантовым числом и может при заданном п принимать значения l = 0,1,2,…(n-1). (3.14.15) Параметр т - магнитное квантовое число может иметь значения т = -l, -l+1,…,-1, 0, +1,…,l – 1, l. (3.14.16) Используя условие нормировки и вид - функции (3.14.14) и проинтегрировав ее по всем возможным углам , , можно найти вероятность обнаружить электрон на расстоянии от ядра. На рис. 3.14.1 приведены графики плотности вероятности для атома водорода для состояний 1s (п =1, l = 0) и 2s (п = 2, l = 0), r1 - первый боровский радиус. Пунктирами отмечены радиусы соответствующих боровских орбит. Из рисунка видно, что эти радиусы совпадают с наиболее вероятными расстояниями электрона от ядра. Следовательно, в квантовой механике радиус первой боровской орбиты надо истолковать.как такое расстояние от ядра, на котором вероятность обнаружения электрона максимальна. Таким образом, атом водорода можно представить в виде сферически симметричного электронного облака, в центре которого находится ядро. Рис.3.14.1. Из уравнения Шрёдингера следует также, что квантованным будет и момент импульса электрона. Поскольку, как уже говорилось ранее, все три проекции момента импульса одновременно не могут быть определены, то определяют модуль момента импульса М и его проекцию на одну из осей М z M l l 1; (3.14.16) M z m. Из этих формул вытекает, что М z < M. Следовательно, направление момента импульса не может совпадать с выделенным в пространстве направлением. Это согласуется с тем обстоятельством, что направление механического момента в пространстве является неопределенным. При переходе атома из одного состояние в другое изменяется его энергия, что сопровождается излучением или поглощением фотона. Так как фотон имеет не равный нулю момент импульса, то момент импульса атома должен соответ89 ственно измениться. Поэтому возможны только такие переходы, при которых азимутальное квантовое число изменяется на единицу l 1. Лекция 3.15 Многоэлектронные атомы. Спин электрона. Распределение электронов по энергетическим уровням. Спин электрона. В атоме водорода (или водородоподобном) энергия атома определяется только главным квантовым числом п и не зависит от двух других квантовых чисел. Это связано с тем, что электрическое поле ядра атома – кулоновское, т.е. обратно пропорционально квадрату расстояния. В многоэлектронных атомах ситуация меняется. Например, в атомах щелочных металлов внешний (валентный) электрон находится в электрическом поле атомного остова, включающего в себя ядро и внутренние электроны. Это поле уже не будет обратно пропорционально квадрату расстояния до центра. Благодаря этому получается зависимость энергии электрона не только от главного квантового числа п, но и от орбитального числа l. С этим связано отличие энергетического спектра, а, следовательно, и спектра испускания щелочных металлов от водородного. Исследование спектров щелочных металлов при помощи приборов с большой разрешающей способностью показало еще одно их отличие от спектра водорода. Оказалось, что спектральные линии щелочных металлов имеют так называемую дублетную структуру, т.е. каждая линия состоит из двух очень близко расположенных. Примером может служить желтый дублет натрия, состоящий из двух линий с длинами волн 589,0нм и 589,6нм. То же относится и к другим линиям. Для описания этой структуры трех квантовых чисел оказалось недостаточно – потребовалось четвертое квантовое число. Это явилось главным мотивом, послужившим американским ученым Дж. Уленбеку и С. Гаудсмиту в 1925 г. для введения гипотезы о спине электрона. Суть ее состоит в том, что у электрона есть не только момент импульса, связанный с перемещением его как целого вокруг ядра. Электрон имеет также собственный или внутренний механический момент, названный спином (от английского слова tо spin – вертеться). Первоначально Уленбек и Гаудсмит предполагали, что спин обусловлен вращением электрона вокруг своей оси, напоминая в этом смысле классический волчок. Существовавшая в то время модель атома получила еще большее сходство с Солнечной системой. Однако от такого модельного представления пришлось по ряду причин отказаться. В 1928 г. П. Дирак показал, что спин электрона содержится в его теории Электрона, основанной на релятивистском волновом уравнении. Таким образом, спин электрона оказался квантово – релятивистским эффектом, не имеющим классического истолкования. Затем концепция спина была распространена на другие элементарные частицы. 90 Величина собственного момента импульса М s и его проекции на выделенное направление M sz определяются спиновым квантовым числом s и магнитным спиновым квантовым числoм m s : M s s s 1; (3.15.1) M sz ms . Для электрона s = 1 , ms s 1 . 2 2 Рассмотрим на примере атома натрия, как наличие спина объясняет дублетную структуру линий. Можно показать, что момент атомного остатка, включающего в себя ядро и внутренние электроны, равен нулю. Поэтому момент атома натрия равен моменту валентного электрона, а он, в свою очередь, складывается из орбитального и спинового моментов. Сложение этих моментов осуществляется по квантовым законам. Полный механический момент определяется квантовым числом j: (3.15.2) M j j j 1; j l s , l s Таким образом, энергия данного состояния зависит от главного квантового числа п и от квантового числа и различается для случая «параллельной» и «антипараллельной» ориентации орбитального и спинового моментов, что приводит к небольшому различию в энергиях излученных фотонов. Принцип Паули. Распределение электронов в атоме по энергетическим уровням. В отличие от макроскопических тел однотипные частицы микромира (электроны и др.) обладают совершенно одинаковыми свойствами: у них одинаковы масса, электрический заряд, спин и др. В связи с этим возникает вопрос, как отличить одну частицу от другой. Рассмотрим систему из двух электронов. С классической точки зрения электрон движется по определенной траектории, так что принципиально возможно проследить за движением каждого. Обнаружив электрон в какой – то последующий момент времени, можно в принципе сказать, будет это электрон 1 или электрон 2. С изложенной точки зрения одинаковые частицы принципиально различимы или индивидуализированы. Иначе обстоит дело с точки зрения квантовой механики, отвергающей классическое представление о движении частицы по траектории. Состояние системы частиц описывается в квантовой механике волновой функцией, которой дается вероятностное толкование. Обнаружив в какой – то момент времени один из электронов, принципиально невозможно решить, будет это электрон 1 или 2. Одинаковые частицы принципиально неразличимы или обезличены. Это положение можно сформулировать в виде принципа тождественности одинаковых частиц: в системе одинаковых частиц реализуются только такие состояния, которые не меняются при перестановке местами двух любых частиц. Отсюда следует положение, высказанное в 1925 г. швейцарским физиком В. Паули, которое носит название принципа Паули: в квантовомеханической си- 91 стеме не могут находиться две тождественные частицы с полуцелым спином. Этот принцип дает объяснение периодической повторяемости свойств атомов. Состояние электрона определяется четырьмя квантовыми числами: главным п, орбитальным l, магнитным ml , магнитным спиновым m s . Из принципа Паули следует, что в атоме не может быть двух электронов, имеющих одинаковыми все четыре квантовых числа. Учитывая возможные значения квантовых чисел, можно найти, что при заданном значении главного квантового числа п количество электронов, у которых отличаются остальные квантовые числа равно 2 п 2 . Периодическая система элементов Менделеева. Высказанное положение объясняет построение периодической системы химических элементов Д.И.Менделеева. В основе систематики химических элементов лежит заряд ядра. Если за единицу принять элементарный заряд е, то заряд ядра будет выражаться целым числом, которое принято обозначать Z. Это число определяет номер химического элемента в периодической системе и число электронов в атоме. Свойства же элемента зависят прежде всего от числа электронов в электронной оболочке и от ее строения. Химические свойства элемента определяются наружными электронами электронной оболочки. Совокупность электронов атома с заданным значением главного квантового числа образуют электронный слой. Слои принято обозначать прописными буквами латинского алфавита K, L, M, N,… Совокупность электронов с заданными значениями п и l образует оболочку. Оболочкой называется группа состояний, близких друг к другу по энергии. Электроны из одной оболочки отличаются друг от друга по энергии гораздо меньше, чем электроны из различных оболочек. Рассмотрим теперь, как меняются электронные конфигурации при переходе от одного атома к другому в порядке возрастания их атомных номеров Z. При возрастании Z на единицу увеличивается заряд ядра, а к электронной оболочке атома добавляется один электрон. При этом вновь получаемая конфигурация из Z+1 электронов должна обладать наименьшей энергией. Однако, в состоянии с наименьшей энергией, соответствующей состоянию с п = 1, могут находиться только два электрона, у которых не совпадают все квантовые числа, т.е. не являющихся тождественными. Поэтому только у водорода и гелия в основном состоянии электроны находятся на К – слое (п=1). Когда же в атоме появляется третий электрон (литий), он не может находиться в состоянии с п=1 и начинается заполнение L – слоя (п=2), который может содержать уже 8 электронов. Заполнение L- слоя заканчивается на неоне. И так далее. Таким образом идет заполнение электронных оболочек, начиная с низшей. Квантовая теория объясняет происхождение периодического закона Д.И.Менделеева. В химическую связь вступают только те электроны, которые при сближении атомов могут изменить свое состояние. Такие электр оны называют валентными, и они находятся на внешних оболочках атомов. Атомы с одинаковым числом валентных электронов ведут себя сходным 92 образом, проявляя близкие химические, оптические, электрические и магнитные свойства. Размеры всех атомов имеют один и тот же порядок величины ~ 10 10 м, возрастание порядкового номера почти не сказывается на размере атома. Это объясняется тем, что, с одной стороны, с ростом заряда ядра усилив ается притяжение к нему электронов, что должно вести к уменьшению размеров атома. С другой же стороны, из – за принципа Паули увеличение числа электронов приводит к заполнению состояний с большим удалением электронов от ядра, что ведет к увеличению размеров атома. Компенсация этих двух факторов как раз и приводит к тому, что размеры атомов остаются одного порядка. Характеристическое рентгеновское излучение. При переходе с одного энергетического уровня на другой атомы излучают (или поглощают) электромагнитную энергию. Если это переходы внешних электронов, то излучение имеет частоты в оптическом диапазоне. Но атомы излучают не только при переходах внешних электронов. Атом можно возбудить и путем удаления одного из электронов внутренней заполненной оболочки, например, бомбардируя атом пучком электронов с достаточной энергией. После такого возбуждения атом будет излучать при электронных переходах с более высоких оболочек в освободившееся состояние. Такое излучение находится в рентгеновском диапазоне, т.е. имеет гораздо бóльшую частоту. Такое излучение называется характеристическим, поскольку зависит от вида энергетического спектра атома, т.е. зависит от вещества. Лекция 3.16. Спонтанное и индуцированное излучение. Охарактеризуем квантовые процессы испускания и поглощения фотонов атомами. Фотоны испускаются только возбужденными атомами. Излучая фотон, атом теряет энергию, причем величина этой потери связана с част отой фотона соотношением (3.12.7). Если атом, по каким – либо причинам (например, из – за соударения с другим атомом) переходит в возбужденное состояние, это состояние является неустойчивым. Поэтому атом возвращ ается в состояние с меньшей энергией, излучая фотон. Такое излучение называется спонтанным или самопроизвольным. Таким образом, спонтанное излучение происходит без внешнего воздействия и обусловлено только неустойчивостью возбужденного состояния. Различные атомы спонтанно излучают независимо один от другого и генерируют фотоны, которые распространяются в самых разных направлениях. Кроме того, атом может быть возбужден в разные состояния, поэтому излучает фотоны разных частот. Поэтому эти фотоны некогерентны. 93 Если атомы находятся в световом поле, то последнее может вызывать переходы как с низшего уровня на высший, сопровождающиеся поглощением фотона, так и наоборот с излучением фотона. Излучение, вызванное воздействием на атом сторонней электромагнитной волны с резонансной частотой, для которой выполняется равенство (3.12.7), называется индуцированным или вынужденным. В отличие от спонтанного в каждом акте индуцированного излучения участвуют два фотона. Один из них распространяется от стороннего источника и воздействует на атом, а другой и спускается атомом в результате этого воздействия. Характерной чертой индуцированного излучения является точное совпадение состояния испущенного фотона с состоянием внешнего. Оба фотона имеют одинаковые волновые векторы и поляризации, у обоих фотонов одинаковы также частоты и фазы. Это означает, что фотоны индуцированного излучения всегда когерентны с фотонами, вызвавшими это излучение. Находящиеся в световом поле атомы могут также поглощать фотоны, в результате чего атомы возбуждаются. Резонансное поглощение фотонов атомами всегда является индуцированным процессом, происходящим только в поле внешнего излучения. В каждом акте поглощения исчезает один фотон, а атом переходит в состояние с бóльшей энергией. Какие процессы будут преобладать при взаимодействии атомов с излучением, испускание или поглощение фотонов, будет зависеть от количества атомов, имеющих большую или меньшую энергию. Эйнштейн применил к описанию процессов спонтанного и вынужденного излучения вероятностные методы. Исходя из термодинамических соображений, он доказал, что вероятность вынужденных переходов, сопровождающихся излучением, должна быть равна вероятности вынужденных переходов, сопровождающихся поглощением света. Таким образом, вынужденные переходы могут с равной вероятностью происходить как в одном, так и в другом направлении. Рассмотрим теперь много одинаковых атомов в световом поле, которое будем полагать изотропным и неполяризованным. (Тогда отпадает вопрос о зависимости вводимых ниже коэффициентов от поляризации и направления излучения.) Пусть N n и N m числа атомов в состояниях с энергиями E n и E m , причем эти состояния могут быть взяты какими угодно из ряда допустимых состояний, но E n E m . N n и N m принято называть заселенностью cam энергетических уровней. Число N nm переходов атомов из состояния E n в состояние E m в единицу времени при спонтанном излучении будет пропорционально числу атомов в состоянии E n : cam (3.16.1) N nm Anm N n . Число переходов атомов между теми же состояниями при индуцированном излучении будет также пропорционально заселенности п – ого уровня, но еще спектральной плотности энергии излучения, в поле которого находятся атомы u nm : 94 инд (3.16.2) N nm Впт N n u . Число же переходов с т – ого на п – ый уровень за счет взаимодействия с излучением инд (3.16.3) N mn Bmn N mu . Величины Апт , Впт , Втп называются коэффициентами Эйнштейна. Равновесие между веществом и излучением будет достигнуто при условии, что число атомов, совершающих в единицу времени переход из состояния п в состояние т будет равно числу атомов, совершающих переход в обратном направлении: Anm N n Bnm N n u Bmn N m u (3.16.4) Как уже говорилось, вероятность вынужденных переходов в одном и другом направлениях одинакова. Поэтому Впт Втп . Тогда из (3.16.4) можно найти плотность энергии излучения u A 1 . (3.16.5) u nm Bnm N m N n 1 Равновесное распределение атомов по состояниям с различной энергией определяется законом Больцмана N n e E kT . Тогда из (3.16.5) получим A A 1 1 , (3.16.6) u nm E E kT nm kT Bnm e 1 Bnm e 1 Что хорошо согласуется с формулой Планка (3.10.23). Это согласие приводит к заключению о существовании индуцированного излучения. n n m Лазеры. В 50 – х годах двадцатого века были созданы устройства, при прохождении через которые электромагнитные волны усиливаются за счет вынужденного излучения. Сначала были созданы генераторы, работавшие в ди апазоне сантиметровых волн, а несколько позднее был создан аналогичный прибор, работающий в оптическом диапазоне. Он был назван по первым буквам английского названия Light Amplification by Stimulated Emission of Radiation (усиление света с помощью вынужденного излучения) – лазер. Лазеры называют также оптическими квантовыми генераторами. Чтобы при прохождении вещества интенсивность излучения возрастала, необходимо чтобы для каждой пары атомных состояний, переходы между которыми происходят с испусканием и поглощением фотонов, заселенность состояния с большей энергией была больше заселенности состояния с меньшей энергией. Это означает, что тепловое равновесие должно быть нарушено. Говорят, что вещество, в котором состояние атомов с более высокой энергией заселено больше, чем состояние с меньшей энергией, обладает инверсией заселенностей. 95 Проходя через вещество с инверсией заселенностей двух атомных состояний, излучение обогащается фотонами, вызывающими переходы между этими атомными состояниями. В результате происходит когерентное усиление излучения на определенной частоте, когда преобладает индуцир ованное испускание фотонов над их поглощением при переходах атомов между состояниями с инверсией заселенностей. Вещество с инверсией заселенностей называют активной средой. Чтобы создать состояние с инверсией заселенностей, необходимо затр ачивать энергию, расходуя ее на преодоление процессов, восстанавлива ющих равновесное распределение. Такое воздействие на вещество называе тся накачкой. Энергия накачки всегда поступает от внешнего источника к активной среде. Существуют различные способы накачки. Для создания инверсии заселенностей уровней в лазерах наиболее часто используется метод трех уровней. Рассмотрим суть этого метода на примере рубинового лазера. Рубин представляет собой окись алюминия, в которой некоторые из атомов алюминия замещены атомами хрома. Энергетический спектр атомов (ионов) хрома содержит три уровня (рис.3.16.1) с энергиями , и . Верхний уровень на самом деле представляет собой достаточно широкую полосу, образованную совокупностью близко расположенных уровней. Рис.3.16.1. Главная особенность трехуровневой системы состоит в том, что уровень 2, расположенный ниже уровня 3, должен быть метастабильным уровнем. Это означает, что переход в такой системе запрещен законами квантовой механики. Этот запрет связан с нарушением правил отбора квантовых чисел для такого перехода. Правила отбора не являются правилами абсолютного запрета перехода . Однако, их нарушение для некоторого квантового перехода значительно уменьшает его вероятность. Попав в такое метастабильное состояние, атом задерживается в нем. При этом время жизни атома в метастабильном состоянии Е 2 ( ) в сотни тысяч раз превышает время жизни атома в 96 обычном возбужденном состоянии Е3 ( ). Это обеспечивает возможность накопления возбужденных атомов с энергией . Поэтому создается инверсная заселенность уровней 1 и 2. Процесс поэтому происходит следующим образом. Под действием зеленого света лампы – вспышки ионы хрома переходят из основного состояния Е1 в возбужденное Е3 . Обратный переход происходит в два этапа. На первом этапе возбужденные ионы отдают часть своей энергии кристаллической решетке и переходят в метастабильное состояние Е 2 . Создается инверсная заселенность этого состояния. Если теперь в рубине, который приведен в такое состояние, появится фотон с длиной волны 694,3нм (например, в результате спонтанного перехода с уровня Е 2 на Е1 ), то индуцированное излучение приведет к размножению фотонов, точно копирующих первоначальный (когерентных). Этот процесс носит лавинообразный характер и приводит к возникновению очень большого числа только тех фотонов, которые распространяются под малыми углами к оси лазера. Такие фотоны, многократно отражаясь от зеркал оптического резонатора лазера, проходят в нем большой путь и, следовательно, очень много раз встречаются с возбужденными ионами хрома, вызывая их индуцированные переходы. Поток фотонов при этом распространяется узким пучком, Рубиновые лазеры работают в импульсном режиме. В 1961 г. был создан первый газовый лазер на смеси гелия и неона, работающий в непрерывном режиме. Затем были созданы полупроводниковые лазеры. В настоящее время список лазерных материалов насчитывает много десятков твердых и газообразных веществ. Свойства лазерного излучения. Лазерное излучение обладает свойствами, которых нет у излучения обычных (не лазерных) источников. 1. Излучение лазеров обладает высокой степенью монохроматичности. Интервал длин волн такого излучения составляет ~ 0,01нм. 2. Для излучения лазера характерна высокая временная и пространственная когерентность. Время когерентности такого излучения достигает секунд (длина когерентности порядка 10 8 м), что примерно в 10 8 раз больше времени когерентности обычного источника. Пространственная когерентность у выходного отверстия лазера сохраняется по всему сечению луча. С помощью лазера удается получить свет, объем когерентности которого в 1017 раз превышает объем когерентности световых волн той же интенсивности, полученных от самых монохроматических нелазерных источников. Поэтому излучение лазеров используют в голографии, где нужно излучение с высокой степенью когерентности. 3. Излучение лазера обладает высокой направленностью. Получены лазерные пучки света, угол расходимости которых всего лишь 97 4. 10÷20″. Самые же совершенные прожекторы дают пучки света с углом 1÷2 0 . В связи с узостью пучка лазеры позволяют создавать излучение, интенсивность которого достигает огромных значений. Так, лазер может излучать непрерывно с каждого квадратного сантиметра выходного окна 100Вт. Чтобы таким же образом излучало нагретое тело, его температура должна быть порядка 1012 градусов. Поэтому излучение лазера можно использовать для механической обработки и сварки самых тугоплавких веществ, для воздействия на ход химических реакций и т.д. Лекция 3.17 Энергия молекул. Энергетические зоны в кристаллах. Энергия молекулы. Молекулярные спектры. При образовании молекулы атомы утрачивают свою индивидуальность за счет формирования химических связей и их внешние электронные оболочки претерпевают сильные изменения. Электроны внутренних оболочек при объединении атомов в молекулу остаются в прежних состояниях. Для точного описания свойств молекулы ее удобнее рассматривать как систему из непрерывно колеблющихся ядер, а также электронов, которые быстро движутся вокруг ядер, создавая электронное облако. При этом оказывается, что молекулярные характеристики определяются потенциальной энергией U взаимодействия ядер и электронов (это взаимодействие заключается главным образом в кулоновском притяжении между ядрами и электронами и в отталкивании ядер и соответственно электронов друг от друга). Для молекул каждого вещества существует такое расположении ядер атомов, при котором потенциальная энергия молекулы U минимальна. Это расположение соответствует равенству сил притяжения и отталкивания и называется равновесным. Однако ядра вследствие колебаний постоянно перемещаются около положений равновесия. Кроме того, молекула может вращаться относительно ее центра масс. Простейшей молекулой является молекула водорода, состоящая из двух атомов водорода. В её состав входят два ядра атомов водорода и два электрона. Вследствие взаимодействия между электронами образуется ковалентная химическая связь, при которой электроны движутся около обоих ядер. Квантово-механическую теорию ковалентной связи в молекуле водорода разработали в 1927 году Вальтер Гайтлер и Фриц Лондон. Им удалось решить уравнение Шрёдингера для системы, состоящей из двух ядер и двух электронов. Получающиеся из этого уравнения собственные значения энергии оказываются зависящими от расстояния между ядрами R (рис.3.17.1), где пунктирной линией изображена энергия атома при параллельной ориентации спинов электронов, а сплошной – при антипараллельной ориентации. Образование молекулы возможно лишь при сближении атомов с антипараллельными спинами. Асимптотиче98 ское значение энергии, к которому стремится энергия молекулы при R→ 0 для обеих кривых одинаково и равно сумме энергий изолированных атомов. R0 Аналогично обстоит дело и с другими двухатомными молекулами. Энергия, обусловленная электронной конфигурацией (электронная энергия), имеет минимум при некотором значении R 0 . Изменение электронной конфигурации приводит к изменению кривой зависимости электронной энергии от расстояния между ядрами атомов R. Рис.3.17.1. Таким образом, движение системы происходит в потенциальной яме, а, следовательно, энергетический спектр дискретен. В первом приближении отдельные виды молекулярных движений – движение электронов, колебания и вращение молекулы – можно считать независимыми друг от друга. Поэтому полную энергию молекулы можно представить в виде Е Ее Е к Е р , (3.17.1) где Ее - Энергия, обусловленная электронной конфигурацией (электронная энергия), Е к - энергия, соответствующая колебаниям молекулы (колебательная или вибрационная энергия), Е р - Энергия, связанная с вращением молекулы (вращательная или ротационная энергия). Малым параметром задачи является отношение массы электрона т к массе ядра М. Электронное слагаемое Ее не зависит от этого отношения, колебательное Е к пропорционально т М , вращательное Е р пропорционально m/ M. Поэтому расстояние между вращательными уровнями значительно меньше расстояния между колебательными уровнями, которое в свою очередь значительно меньше расстояния между электронными уровнями Ее » Е к » Е р . Следовательно, схема энергетических уровней двухатомной молекулы выглядит так, как показано на рис.3.17.2, т.е. электронный уровень расщепляется на несколько колебательных, каждый из которых, в свою очередь, расщепляется на вращательные. Таким образом, одному и тому же изменению электронного состояния соответствуют различные изменения колебательной и вращательной энергии. Поэтому при переходах между состояниями с различными энергиями на одно и то 99 Рис.3.17.2. же значение Е е могут накладываться мало отличающиеся друг от друга Ек и Е р . Это приводит к излучению (или поглощению) фотонов мало отличающихся по частоте. Поэтому при наблюдении спектров излучения (или поглощения) с помощью приборов с небольшой разрешающей способностью эти спектры представляются состоящими из отдельных полос – полосатые спектры. Энергетические зоны в кристаллах. В настоящее время для объяснения электрических свойств кристаллов общепринята зонная теория твердого тела. Рассмотрим основные выводы этой теории. В изолированном атоме электроны обладают некоторыми дискретными энергиями. При этом валентные электроны атома могут находиться либо в нормальном, либо в одном из возбужденных состояний. Иначе говоря, валентные электроны изолированного атома могут находиться на одном из энергетических уровней. Самый низкий из этих уровней будет соответствовать невозбужденному основному состоянию. В кристалле вследствие наложения друг на друга многих атомных полей валентный электрон будет взаимодействовать не только со своим положительным ионом (ядро + остальные электроны), но также с ядрами и электронными оболочками других атомов, входящих в кристалл. Такое взаимодействие приводит к 100 расщеплению резко ограниченных уровней в довольно широкую энергетическую полосу или зону, ширина которой оценивается величиной порядка нескольких электрон-вольт, а расстояние между соседними уровнями в зоне составляет ~ 10 23 эВ . Согласно принципу Паули в системе не может быть двух тождественных электронов. Поэтому каждым значением энергии может обладать только два электрона (с противоположными спинами). Это значит, что на каждом энергетическом уровне может находиться два электрона. Возбужденные энергетические уровни также расщепляются на зоны. Ширина возбужденной зоны больше ширины невозбужденной зоны, но имеет тот же порядок (несколько электрон-вольт). Невозбужденную зону принято называть – валентной зоной, ближайшую к ней возбужденную зону - зоной проводимости. Обе эти разрешенные зоны разделяются запрещенной зоной. Энергия кристалла не может принимать значения, лежащие в этой зоне. Электрические и оптические свойства вещества определяются поведением валентных электронов. Энергетические диаграммы твердого тела по зонной теории изображены на рис.3.17.3.Электрические свойства кристаллов определяются структурой энергетических зон, то есть заполнением зон электронами и шириной запрещенной зоны. Рис.3.17.3 Для металлов (рис.3.17.3а) нижняя группа уровней А и В характеризует энергии электронов внутренних оболочек, тесно связанных в атомах. Верхняя зона С содержит энергетические уровни внешних валентных электронов и заполнена только частично. При приложении к металлу электрического поля валентные электроны, ускоряясь полем, могут приобретать небольшие порции энергии и переходить на более высокие уровни внутри зоны С. Таким образом, зону С можно разделить на две части: нижняя ее часть - валентная зона, верхняя - зона проводимости. Для металла эти две зоны непосредственно соприкасаются друг с другом, и электроны свободно переходят из валентной зоны в зону проводимости. Поэтому электроны могут ускоряться даже небольшим электрическим полем и приобретать дополнительную скорость в направлении против 101 электрического поля – возникает электрический ток. Такие кристаллы будут обладать хорошей электропроводностью при любых температурах и независимо от ширины запрещенной зоны. У диэлектриков (рис.3.17.3в) все энергетические уровни валентной зоны полностью заполнены электронами (по два электрона на каждом уровне), а энергетические уровни зоны проводимости совершенно свободны (при абсолютном нуле температур). Зона проводимости С отделена от валентной зоны В широким интервалом (запрещенная зона). Ширина запрещенной зоны у диэлектриков велика (5÷ 10 эВ). При любых температурах, отличных от абсолютного нуля, в зоне проводимости находится небольшое количество электронов, попадающих туда за счет флуктуаций тепловой энергии. Электроны, попадающие по своему энергетическому состоянию в зону проводимости, при наложении внешнего поля будут участвовать в упорядоченном движении (т.к. рядом имеются свободные энергетические уровни), то есть будут создавать электрический ток. Поэтому возбужденная зона называется зоной проводимости. Эти электроны обуславливают некоторую проводимость диэлектриков, вследствие чего удельное сопротивление не бесконечно велико, а имеет конечное значение. При очень низких температурах зона проводимости у диэлектриков свободна от электронов, а большая ширина запрещенной зоны исключает возможность перехода электронов из валентной зоны в зону проводимости за счет энергии электрического поля. Дело в том, что электрон способен накапливать энергию от электрического поля только на пути свободного пробега, длина которого в реальных кристаллах очень мала (10-6 ÷ 10-7 см), поэтому даже в очень сильных полях порядка 105 В/см электрон не может получить энергию, достаточную для преодоления запрещенной зоны. В полупроводнике распределение разрешенных и запрещенных зон подобно диэлектрику, но в полупроводнике ширина запрещенной зоны (величина Е ) превышает среднюю энергию теплового движения всего лишь в несколько десятков раз (от долей электрон-вольта до 3 эВ), поэтому уже при комнатных температурах часть валентных электронов из зоны В может быть переброшена в зону С и полупроводник начинает проводить электрический ток - электронная проводимость. Отличие такого полупроводника от металла в том, что в металле концентрация свободных электронов постоянна и электрическое сопротивление с ростом температуры возрастает. В полупроводниках рост температуры сопровождается быстрым увеличением числа электронов в зоне проводимости и, следовательно, уменьшением электрического сопротивления. 102 Лекция 3.18. Атомное ядро. Энергия связи. Ядерная энергия. Строение и важнейшие свойства атомных ядер. Ядром называется центральная часть атома, в которой сосредоточена практически вся масса атома и его положительный электрический заряд. Все атомные ядра состоят из элементарных частиц: протонов и нейтронов, которые считаются двумя зарядовыми состояниями одной частицы - нуклона. Протон имеет положительный электрический заряд, равный по абсолютной величине заряду электрона. Нейтрон не имеет электрического заряда. Зарядом ядра называется величина Ze, где е - величина заряда протона, Z - порядковый номер химического элемента в периодической системе Менделеева, равный числу протонов в ядре и называемый зарядовым числом. Число нуклонов в ядре A=N+Z называется массовым числом. N – число нейтронов в ядре. Нуклонам (протону и нейтрону) приписывается массовое число, равное единице. Ядра с одинаковыми Z, но различными А называются изотопами. Ядра, которые при одинаковом А имеют различные Z, называются изобарами. Ядро химического элемента X обозначается ZA Х , где Х - символ химического элемента. Всего известно около 300 устойчивых изотопов химических элементов и более 2000 естественных и искусственно полученных радиоактивных изотопов. Размер ядра характеризуется радиусом ядра, имеющим условный смысл ввиду размытости границы ядра. Существует эмпирическая формула для радиуса ядра, которая показывает пропорциональность объема ядра числу нуклонов в нем. Плотность ядерного вещества составляет по порядку величины 1017 кг/м3 и постоянна для всех ядер. Она значительно превосходит плотности самых плотных обычных веществ. Энергия связи ядер. Дефект массы. Нуклоны в ядрах находятся в состояниях, существенно отличающихся от их свободных состояний. За исключением ядра обычного водорода во всех ядрах имеется не менее двух нуклонов, между которыми существует особое ядерное сильное взаимодействие - притяжение - обеспечивающее устойчивость ядер, несмотря на отталкивание одноименно заряженных протонов. Для того чтобы атомные ядра были устойчивыми, протоны и нейтроны должны удерживаться внутри ядер огромными силами, во много раз превосходящими силы кулоновского отталкивания протонов. Они представляют собой проявление самого интенсивного из всех известных в физике видов взаимодействия – так называемого сильного взаимодействия. Ядерные силы примерно в 103 100 раз превосходят электростатические силы и на десятки порядков превосходят силы гравитационного взаимодействия нуклонов. Важной особенностью ядерных сил является их короткодействующий характер. Ядерные силы являются короткодействующими, т.е. заметно проявляются, как показали опыты Резерфорда по рассеянию α-частиц, лишь на расстояниях порядка разме–12 –13 ров ядра (10 ÷10 см). На больших расстояниях проявляется действие сравнительно медленно убывающих кулоновских сил. На основании опытных данных можно заключить, что протоны и нейтроны в ядре в отношении сильного взаимодействия ведут себя одинаково, т. е. ядерные силы не зависят от наличия или отсутствия у частиц электрического заряда. Важнейшую роль в ядерной физике играет понятие энергии связи ядра. Энергия связи ядра равна минимальной энергии, которую необходимо затратить для полного расщепления ядра на отдельные частицы. Из закона сохранения энергии следует, что энергия связи равна той энергии, которая выделяется при образовании ядра из отдельных частиц. Энергию связи любого ядра можно определить с помощью точного измерения его массы. В настоящее время физики научились измерять массы частиц – электронов, протонов, нейтронов, ядер и др. – с очень высокой точностью. Эти измерения показывают, что масса любого ядра Mя всегда меньше суммы масс входящих в его состав протонов и нейтронов: Mя < Zmp + N mn. Здесь т р - масса протона, тп - масса нейтрона. Разность масс ΔM = Zmp + Nmn – Mя. (3.18.1) (3.18.2) называется дефектом массы. Согласно принципу эквивалентности массы и энергии дефект массы представляет собой массу, эквивалентную работе, затраченной ядерными силами, чтобы собрать все нуклоны вместе при образовании ядра. Эта величина равна изменению потенциальной энергии нуклонов в результате их объединения в ядро. По дефекту массы с помощью формулы Эйнштейна E = mc2 можно определить энергию, выделившуюся при образовании данного ядра, т. е. энергию связи ядра Eсв: Eсв = ΔMc2 = (Zmp + Nmn – Mя)c2. ся при образовании ядра в виде излучения γ-квантов. 104 (3.18.3) Эта энергия выделяет- Другим важным параметром ядра является энергия связи, приходящаяся на один нуклон ядра, которую можно вычислить, разделив энергию связи ядра на число содержащихся в нём нуклонов: Эта величина представляет собой среднюю энергию, которую нужно затратить, чтобы удалить один нуклон из ядра, или среднее изменение энергии связи ядра, когда свободный протон или нейтрон поглощается в нём. Рис.3.18.1. На рис.3.18.1 представлена зависимость удельной энергии связи от массового числа, т.е. числа нуклонов в ядре. Как видно из рисунка, при малых значениях массовых чисел удельная энергия связи ядер резко возрастает и достигает максимума при (примерно 8,8 Мэв). Ядра с такими массовыми числами наиболее устойчивы. С дальнейшим ростом средняя энергия связи уменьшается, однако в широком интервале массовых чисел значение энергии почти постоянно ( МэВ), из чего следует, что можно записать . Такой характер поведения средней энергии связи указывает на свойство ядерных сил достигать насыщения, то есть на возможность взаимодействия нуклона только с малым числом «партнёров». Если бы ядерные силы не обладали свойством насыщения, то в пределах радиуса действия ядерных сил каждый 105 нуклон взаимодействовал бы с каждым из остальных, и энергия взаимодействия была бы пропорциональна , а средняя энергия связи одного нуклона не была бы постоянной у разных ядер, а возрастала бы с ростом . Из факта убывания средней энергии связи для ядер с массовыми числами больше или меньше 50-60 следует, что для ядер с малыми энергетически выгоден процесс слияния — термоядерный синтез, приводящий к увеличению массового числа, а для ядер с большими — процесс деления. В настоящее время оба этих процесса, приводящих к выделению энергии, осуществлены. Первый неуправляемо идет в водородной бомбе. Второй – неуправляемо в атомной бомбе, а управляемо – в ядерных реакторах, широко используемых для получения энергии. Энергия связи ядра на много порядков превышает энергию связи электронов с атомом. Поэтому энергия, выделяющаяся при ядерных реакциях, гораздо больше энергии, получаемой другими способами. Приведем примеры. Если два ядра дейтерия (изотопа водорода) объединяются в ядро гелия, то выделяется 24МэВ энергии. Деление одного ядра с массовым числом 240 (удельная энергия связи 7,5МэВ) на два ядра с массовыми числами 120 (удельная энергия связи 8,5МэВ) привело бы к высвобождению энергии 240МэВ. Для сравнения: соединение одного атома углерода с двумя атомами кислорода (сгорание угля) сопровождается выделением энергии 5эВ. 106