Un cuadernillo en Ciencia de los Materiales
P. Dip-Segovia Alumno del programa de Doctorado en Ciencias de la Ingenierí...
476 downloads
1478 Views
8MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Un cuadernillo en Ciencia de los Materiales
P. Dip-Segovia Alumno del programa de Doctorado en Ciencias de la Ingeniería con Mención en Ciencias de los Materiales. Escuela de Postgrado Facultad de Ciencias Físicas y Matemáticas Universidad de Chile
______________________________________________________________________ P.D-S
1
1
Teoría Electrónica de los Metales 1.1.
El principio de la duda (o incertidumbre)
Uno de los fundamentos principales de la teoría atómica moderna y, en particular, de la teoría electrónica de los metales, es el principio de la duda de Heisemberg. La antigua teoría del átomo de Bohr se basaba sobre la simple teoría de la mecánica Newtoniana. En principio, se supuso que un electrón viajaba alrededor del núcleo en órbitas circulares igual o similar a los planetas en torno del sol. En cada órbita de Bohr, se supuso que el electrón tenía una velocidad conocida de manera que, teóricamente, sería posible medir la posición de un electrón en su órbita en dos tiempos diferentes y determinar de ese modo la distancia recorrida durante el intervalo de tiempo dado. Ahora se reconoce que es imposible una medición precisa de esta naturaleza sobre una partícula del tamaño de un electrón, tanto en la teoría como en la práctica. No tenemos el tiempo suficiente para establecer el principio de la duda, esto es, la condición que revela las limitaciones; lo mejor que podemos hacer es describirlo brevemente. Supóngase que un electrón es está moviendo a lo largo de una línea recta, como en la Fig. 1.1.
x ∆x Fig. 1.1 La duda en la posición de un electrón. Sea x la distancia del electrón desde el centro de coordenadas. Cuando determinamos experimentalmente esta cantidad siempre hay un error experimental ± ∆x / 2. En otras palabras, la incertidumbre en la posición es ∆x. Ahora consideremos p = mv , el momento del electrón. Cualquier medición experimentalmente del momento del electrón implicará también una incertidumbre ∆p . El principio de Heisemberg establece que el producto de estas dos incertidumbres no puede ser menor que la constante h de Planck, o
∆p ⋅ ∆x ≥ h
El principio de la incertidumbre, tiene poca importancia para medir la posición o momentun de objetos grandes. Esto se debe al pequeño tamaño de la constante de Planck relativa a las cantidades medidas. Sin embargo, para partículas tan pequeñas como un átomo, electrón es extremadamente importante, como puede verse aquí. Supóngase que el electrón tiene un momento cero significando que está en reposo. Entonces tenemos
∆x =
h h = =∞ ∆p 0
lo cual nos dice que la duda en la posición del electrón es infinita, o que seríamos completamente incapaces de localizarla. Por otra parte, si fuésemos capaces en algún ______________________________________________________________________ P.D-S
2
momento de determinar la posición exacta de un electrón estaríamos totalmente ignorantes de su velocidad. En consecuencia, aun cuando pueda conocerse la posición de su electrón estaríamos totalmente ignorantes de su velocidad. En consecuencia, aun cuando pueda conocerse la posición de un electrón en un momento dado, no seríamos capaces de predecir su posición a cierto instante futuro de tiempo. Lo anterior es una fuerte evidencia de que la teoría de Bohr no está basada sobre fundamentos teóricos sólidos, pues esto último implica que la posición y momentun del electrón se pueden medir con precisión en cualquier instante. Es interesante que se pueda emplear este principio para explicar el por qué de la energía vibracional de un sólido no es cero al cero absoluto. Si se desvaneciese la energía de punto cero, cada átomo del sólido estaría en reposo en su posición reticular de equilibrio. Su momentun sería cero y su posición sería fija y determinable. Este razonamiento no está claramente de acuerdo con el principio de la duda.
1.2.
La doble naturaleza de la materia
Tanto la materia como la luz tienen una naturaleza doble: corpuscular y ondulatoria. Consideremos un electrón. Es un hecho bien conocido de que un electrón simple lleva una carga eléctrica limitada y que se puede medir (e = 1,60 × 10 −19 coulombios) , lo cual es una propiedad corpuscular, como es el hecho de que un electrón tiene una masa en reposo limitada (m0 = 9,11 × 10 −28 g ) . Por otra parte, cuando un haz de electrones consistiendo en un gran número de electrones se hace incidir sobre un material cristalino, puede ser difractado de acuerdo con la misma ley de rayos X electromagnéticos, provisto que la longitud de onda de un electrón sea expresada por la relación de De Broglie.
λ=
h h = mv p
donde λ : es la longitud del electrón. m : masa del electrón. v : su velocidad. p : momentun. Esta habilidad de los electrones de ser difractados muestra una vez más las características ondulatorias que posee. Si los electrones son ondas realmente, nos encaramos con el problema de decir que clase de onda son. Nuestro problema básico es que el principio de Incertidumbre no nos permite utilizar el concepto del electrón como una partícula, como se implica en la teoría de Bohr. Por otra parte, somos incapaces de definir un electrón en términos de ondas. Afortunadamente hay un acercamiento matemático a esta materia que obvia la necesidad de definir exactamente un electrón. Este acercamiento se hace a través de la mecánica ondulatoria, cuyo resultado se expresa habitualmente en términos de la energía de un electrón. La energía es, por supuesto, una propiedad importante. Como sabemos, la energía de radiación de un átomo (posiblemente la de un átomo de hidrógeno) está relacionada por la ley de Planck a la diferencia en las energías del electrón en dos estados diferentes en el átomo, o ______________________________________________________________________ P.D-S
3
hv = E II − E I donde h : es la constante de Planck. v : es la frecuencia de radiación. E I E II : son la energías en dos niveles diferentes de energía atómica. Mientras que la mecánica ondulatoria puede rendir estimaciones precisas de las posibles energías de un electrón, no puede dar una información similar sobre las posiciones de los electrones. Lo que da una idea de las regiones en el espacio donde se hallará probablemente un electrón. La mecánica ondulatoria, en consecuencia está relacionada estrechamente con el concepto de la probabilidad. Con el propósito de ver cómo entra el concepto de la probabilidad en el problema de la dinámica electrónica, consideremos primero un sencillo experimento óptico. La difracción de la luz a través de una rendija, bajo las condiciones experimentales mostradas en la fig. 8.2A produce un diagrama de difracción semejante al de la fig. 1.2B, donde la abscisa corresponde a las distancias a lo largo del diagrama, y la altura de éste representa la intensidad de la radiación cayendo sobre la placa fotográfica o sobre algún dispositivo para registrar el diagrama. Por definición, la intensidad de la luz es la energía por segundo que cae sobre un centímetro cuadrado, de manera que la ordenada en la fig.1.2B representa el grado al cual cae la energía en varios puntos a lo largo del diagrama. Ahora consideremos este mismo experimento desde un punto de vista corpuscular. En este caso, la altura del diagrama debe ser proporcional al número de cuantos de luz cayendo por segundo sobre un área unitaria de la pantalla en cualquier punto dad. Sin embargo, todavía hay otro medio de que esta difracción pueda ser vista. Supóngase que sólo pasa un cuanto de luz a través de la rendija, entonces la ordenada del diagrama de difracción se considera que representa la contingencia, o probabilidad, de que el cuanto caiga en un punto dado de la pantalla. De acuerdo con este punto de vista, el área bajo la curva completa debe ser la unidad, esto es, el cuanto debe incidir en alguna parte a lo largo de la pantalla. Rendija rectangular
x Fuente de luz Lentes
Pantalla
______________________________________________________________________ P.D-S
4
Intensidad de luz
x
Fig. 1.2 (A) Disposición experimental para la difracción de Fraunhofer utilizando una rendija simple. (B) Diagrama de difracción de Fraunhofer para una rendija sencilla. Del experimento de difracción anterior puede verse que la ordenada puede considerarse para medir bien la intensidad de luz en una posición dada, o la posibilidad de que un simple cuanto incida sobre ella. En efecto, hay una correspondencia directa entre la intensidad de luz y la probabilidad como se le definió anteriormente. En la mecánica ondulatoria, se trata las propiedades ondulatorias de los electrones desde este punto de vista de probabilidad. A continuación consideremos una onda sencilla que se ajusta a la relación siguiente:
2πx y = y 0 sen 2πvt − λ
Esto puede representar una onda en una cinta infinita excitada por la vibración de un diapasón eléctrico conectado en un extremo. Como se indica en la fig. 1.3, λ es la longitud de onda, y 0 es su amplitud, y la onda vieja en la dirección positiva x . Además, en la ecuación anterior, v es la frecuencia, o número de vibraciones por segundo, x es la distancia en la dirección de desplazamiento, y t es el tiempo. La ecuación anterior se puede escribir también en forma más simple
y = y0 sen(ωt − kx )
donde ω = 2πv es la frecuencia angular, y k = 2π / λ se conoce como el número de la onda. Es bien conocida la ley de física de que la intensidad de una onda es proporcional al cuadrado de la amplitud de onda, o
I ≈ y0
2
donde I es la intensidad, y y 0 es la amplitud. Sin embargo, hemos visto anteriormente que la intensidad está relacionada directamente a la probabilidad de que un cuanto (o electrón) caiga en un punto dado. En consecuencia, por analogía, definamos la función ψ de manera que ______________________________________________________________________ P.D-S
5
P =ψ 2 Aquí, P es la probabilidad y ψ es una función que, cuando se le multiplica por sí misma, produce la probabilidad P. Realmente, con mayor exactitud debido a que la función ψ es con frecuencia un número complejo, deberíamos escribir la expresión anterior en la forma siguiente:
P = ψψ * donde ψ y ψ * son recíprocos complejos, y sus productos, la probabilidad, es un número real.
Fig. 1.3 Onda viajando en una larga cinta infinita. Es evidente que la cantidad ψ equivale a la amplitud de una onda, de manera que podemos escribir (por analogía con nuestra expresión para una onda como se da anteriormente):
ψ = ψ 0 sen(ωt − kx )
Ahora hallemos el segundo derivado de esta función con respecto a la distancia
dψ = + kψ 0 cos(ωt − kx ) dx
y
d 2ψ = − k 2ψ 0 sen(ωt − kx ) = − k 2ψ 2 dx o
d 2ψ = + k 2ψ = 0 2 dx Esta ecuación diferencial es la ecuación básica para el movimiento ondulatorio en una dimensión. Una de las soluciones es, por supuesto,
ψ = ψ 0 sen(ωt − kx )
Por definición, la cantidad k en la ecuación diferencial anterior es el número ondulatorio y es igual a 2π/λ. Ahora supongamos que podemos sustituir la longitud de onda de Broglie del electrón, λ = h / mv , en el número de onda k de manera que ______________________________________________________________________ P.D-S
6
k=
2π
λ
=
2π mv h
y
4π 2 2 2 8π 2 1 2 k = 2 m v = 2 m mv h h 2 2
donde 1 / 2mv 2 es claramente la energía cinética de un electrón. La expresión anterior para k 2 puede ser sustituida ahora en la ecuación ondulatoria con el resultado siguiente:
d 2ψ 8π 2 1 2 + 2 m mv ψ = 0 2 dx h 2 Esta es la bien conocida ecuación ondulatoria de Schrödinger en una dimensión. En tres dimensiones (x,y,z) , se tiene la forma
∂ 2ψ ∂ 2ψ ∂ 2ψ 8π 2 1 2 + + + 2 m mv ψ = 0 ∂x 2 ∂y 2 ∂z 2 h 2 Debido a que la energía cinética de un electrón es igual a su energía total menos su energía potencial, la ecuación de Schrödinger se escribe usualmente:
∂ 2ψ ∂ 2ψ ∂ 2ψ 8π 2 + + + 2 m(W − V )ψ = 0 ∂x 2 ∂y 2 ∂z 2 h donde W − V = 1 / 2mv 2 , W es la energía total del electrón y V es su energía potencial.
1.3.
Teoría del electrón libre
Ahora presentaremos brevemente la teoría del electrón libre de Sommerfeld de un metal. Sus suposiciones básicas son que los electrones de valencia en un metal son libres y que están confinados a moverse dentro de los límites de un objeto metálico, esto es, se mueven de un lado para otro dentro del metal, pero no lo abandonan. Esta idea conforma con el concepto de que los electrones tienen una energía potencial menor dentro del metal que fuera de él o que toma trabajo remover un electrón de una pieza metálica. En la teoría de Sommerfeld, se supone también que el potencial de un electrón es constante en el interior de un metal. El enunciado es una sobresimplificación, porque un electrón se mueve realmente en un campo potencial muy complicado debido a la presencia tanto de los demás electrones como de la disposición periódica de iones cargados positivamente dentro del metal. A pesar de esta simplificación, la teoría elemental rinde ciertos resultados importantes. Al desarrollarla, consideremos primero lo que se conoce como el problema de “la partícula dentro de una caja”. Aquí suponemos que un electrón está confinado dentro de una caja y que su energía potencial es cero (constante) dentro de la caja e infinita fuera de ella. Estas condiciones sobre el potencial nos aseguran que la probabilidad de hallar un electrón fuera de la caja será cero, lo cuál, a su vez nos dice que cualquier solución ψ de la ecuación ondulatoria
______________________________________________________________________ P.D-S
7
∂ 2ψ ∂ 2ψ ∂ 2ψ 8π 2 + 2 + 2 + 2 m(W − V )ψ = 0 2 ∂x ∂y ∂z h debe ser cero en todos los puntos fuera de la caja y, en particular, en los límites de la misma. Para la simplicidad, supongamos que el electrón es capaz de moverse en una sola dirección, de manera que estamos trabajando efectivamente con una caja unidimensional.
Fig. 1.4 Pozo potencial dentro de una caja unidimensional como se supone en la teoría del electrón libre. El problema básico se ilustra ahora en la figura 1.4 donde se ha seleccionado la longitud de la caja como igual a L. Por la condición de que ψ debe ser cero en los límites, tenemos
ψ =0 ψ =0
a
x=0 x=L
a Estas son las mismas condiciones de contorno que se aplican a la amplitud de vibración de ondas que viajan en una cinta de longitud L cuyos extremos están fijos. Debido a que la misma ecuación ondulatoria básica controla el movimiento de los electrones en una dimensión y la vibración de una cinta, podemos utilizar las soluciones conocidas de la cinta de los extremos fijos para poder definir las soluciones del electrón en la caja. Es bien sabido que una cinta de este tipo es capaz de vibrar aciertas frecuencias naturales. Estas frecuencias, por supuesto, se determinan por los diagramas de las posibles ondas estacionarias que pueden desarrollarse en una cinta de longitud L. Así, en la figura 1.5, la frecuencia fundamental, o menor, de la cinta vibratoria tiene una longitud de onda L, el tercero a 2/3L, etc., y, en general, podemos escribir
n z = 1,2,3,... λ=
2 L nz
nz = 1,2,3,4,...
______________________________________________________________________ P.D-S
8
Figura 1.5 Ondas estacionarias en una cinta con extremos fijos. donde n z supone valores enteros desde uno hasta el infinito. Esta misma condición es válida para las ondas estacionarias de la función ψ del electrón en la caja unidimensional y, por definición, k = 2π / λ , de manera que
k=
n zπ L
y
nz π 2 k = 2 L 2
2
Sin embargo, ya hemos visto que, en general,
8π 2 k = 2 m(W − V ) h 2
pero dentro de la caja, donde existen las ondas estacionarias, suponemos que V es cero, por lo que
8π 2 8π 2 k = 2 mW = 2 mE h h 2
donde W es la energía total del electrón y E es la energía cinética del mismo. Igualando los dos valores dados anteriormente para k 2 y resolviendo para E se tiene 2
h 2 nz E= 8mL2
nz = 1,2,3,...
______________________________________________________________________ P.D-S
9
Este resultado es extremadamente importante porque muestra que la energía de un electrón en un metal se cuantiza; puede tener únicamente ciertos valores fijos correspondiendo a valores enteros del número cuántico n z . En una caja tridimensional, pueden disponerse ondas estacionarias del tipo descrito anteriormente a lo largo de cada uno de los tres ejes primarios, resultando en una onda estacionaria tridimensional. Ahora, si se supone que la caja es un cubo con una longitud L en cada lado, puede mostrarse que la energía del diagrama resultante dela onda estacionaria tridimensional también es cuantizada y dada por la expresión
(
h2 2 2 2 E= nx + n y + nz 2 8mL
)
nx , y , z = 1,2,3,...
El estado energético menor que puede ocupar un electrón en una caja tridimensional ocurre cuando n x = n y = n z = 1 . Su valor es:
(
)
3h 2 h2 2 2 2 E= 1 +1 +1 = 2 8mL 8mL2 Siguiendo al estado energético más bajo, hay dos estados de energía igual. En general, es práctica común denominar a estados diferentes con energías iguales estados degenerados. Los tres estados degenerados presentes ocurren cuando dos números cuánticos son igual uno y el otro es dos: (112), (121) y (211). La energía de estos estados es:
(
)
6h 2 h2 2 2 2 E= 1 +1 + 2 = 8mL2 8mL2 En la tabla 1.1 se dan todos los niveles de energía electrónica en una caja tridimensional con una energía menor de 45h 2 / 8mL2 . La primera columna es proporcional a la energía de los diversos estados. Para simplicidad, en esta columna se dan los valores de 2 2 2 (n x + n y + n z ). Estos valores son proporcionados a la energía debido a que
(n
2 x
2
+ n y + nz
2
)
8mL2 = 2 E h
La segunda columna indica las combinaciones de número cuántico que dan los valores en la columna uno. Obsérvese que, al elevarse la energía, aumenta la frecuencia con la cual más de una combinación de números cuánticos es capaz de rendir la misma energía. La tercera columna enlista la degeneración, o el número de estados con el mismo valor de energía. Sólo cuando todos los números cuánticos de un estado dado tienen el mismo valor [esto es (222)] es posible tener estados degenerados: sólo un estado para un valor de energía dado. La última columna representa la suma de todos los estados de energía hasta un valor de 2 2 2 2 2 2 energía dado; realmente un valor dado de (n x + n y + n z ). Así, cuando (n x + n y + n z ) es 9 hay siete estados con una energía igual a, o menor de, 9h 2 / 8mL2 : uno con una energía igual a 3h 2 / 8mL2 , tres con 6h 2 / 8mL2 , y tres con 9h 2 / 8mL2 . En una pieza de metal de tamaño promedio el número de electrones es muy grande. Por ejemplo, considérese un metal monovalente, tal como la plata, donde hay un electrón libre por átomo. Aquí, 107,9 gr (1 mol) de plata contendrán una cantidad de electrones ______________________________________________________________________ 10 P.D-S
libres igual al número de Abogador 6.02×1023. En teoría de Sommerfeld, se supone que los electrones libres no interactúan unos con otros excepto cuando se aplica el principio de exclusión de Pauli, lo cual significa que, cuando hay una caja hay más de un electrón, puede suponerse que los electrones ocupan los mismos niveles de energía que el electrón simple. Sin embargo, el principio de exclusión de Pauli, que controla el número de electrones que pueden entrar en un estado dado con el átomo de hidrógeno, se aplica también en el presente caso. En otras palabras, sólo dos electrones con movimientos dirigidos en sentido opuesto pueden ocupar un estado cuántico dado.
(n
2 x
TABLA 1.1 NIVELES INFERIORES DE ENERGÍA PARA UN ELECTRÓN EN UNA CAJA 2 2 Combinaciones de Degeneración o Número total de + n y + nz o número cuántico número de estados estados 8mL2 dando el estado con la misma energía E h2 3 (111) 1 1 6 {112} 3 4 9 {122} 3 7 11 {113} 3 10 12 {222} 1 11 14 {123} 3 14 17 {223} 3 17 18 {114} 3 20 19 {133} 3 23 21 {124} 3 26 22 {233} 3 29 24 {224} 3 32 26 {134} 3 35 27 {115} y {333} 4 39 29 {234} 3 42 30 {125} 3 45 32 {334} 3 48 33 {144} y {225} 6 54 35 {135} 3 57 36 {244} 3 60 38 {235} y {116} 6 66 41 {344} y {126} 6 72 42 {145} 3 75 43 {335} 3 78 44 {226} 3 81 45 {245} 3 84
)
Al cero absoluto, los electrones buscarán los estados de energía inferiores en el metal. Puede esperarse que a esta temperatura (comenzando con el estado de energía inferior), todos los estados se llenarán de un par de electrones en cada estado hasta alguno que contenga el electrón con la energía más alta. ______________________________________________________________________ 11 P.D-S
Como un ejemplo, supóngase que tenemos una pequeña pieza de metal conteniendo sólo 120 electrones libres. Al cero absoluto los 120 electrones ocuparán los 60 niveles inferiores de energía en el metal. Todos los niveles hasta, e incluyendo los de una energía de 36h 2 / 8mL2 están llenos. Esto puede confirmarse examinando la tabla 1.1. Todos los estados de energía con valores mayores de 36h 2 / 8mL2 estarán vacíos. En una pieza de metal real, la magnitud de la energía del electrón que queda en el estado de energía más elevado es muy grande aun a 0ºK. Este es un resultado del gran número de electrones involucrados y del gran número de estados cuánticos requeridos para mantenerlos sujetos a todos ellos. Ahora intentaremos determinar la magnitud de esta energía. Para poder hacer esto, debemos derivar primero una relación para el número de estados de energía con una energía igual a, o menor que, la de un estado dado.
Fig. 1.6 Espacio de número cuántico. Como los números cuánticos son enteros positivos, sólo se utiliza la octante superior derecha para designar el estado cuántico, o nivel de energía, de un electrón Formemos un sistema de coordenadas cartesianas tridimensional, utilizando como coordenadas para los tres ejes valores de n x , n y , y n z . Debido a que cada estado de energía de un electrón en una caja corresponde a un juego particular de números cuánticos, se puede representar un estado por un solo punto en el espacio de número cuántico. Así, en la figura 1.6, se designa específicamente el punto que representa al estado con los números cuánticos n x = 4, n y = 5, y n z = 7. Cuando se consideran juntos todos los estados de energía electrónica, forman un red tridimensional de puntos que recuerda a una red espacial cúbica simple. Debido a que los valores de n x , n y y n z son siempre números enteros positivos, la red tiene que quedar en la mismo octante del sistema coordenado que el ocupado por el punto dado en la figura 1.6 (la octante superior derecha). Para simplificar la explicación, reduzacamos a dos el número de coordenadas del metal. Entonces, solo necesitamos considerar dos números cuánticos, n x y n y , y la red tridimensional de puntos que representa los estados de energía se reduce a una cuadrícula rectangular bidimensional del tipo mostrado en la figura 1.7. Nuestro problema básico es ______________________________________________________________________ 12 P.D-S
hallar cuántos estados de energía poseen una energía igual o menor que cierto valor máximo E m . En dos dimensiones, la energía de cualquier estado se por
(
h2 2 2 E= n + n x y 8mL2
)
Esta relación nos dice que la energía de un estado varía directamente según los cuadrados de los dos números cuánticos. Un estado tendrá una energía menor que la de un estado dado 2 2 sólo si sus números cuánticos producen un valor menor de n x + n y que el del estado dado. El ejemplo sencillo siguiente ayudará a comprender el significad de este último enunciado.
(
)
Fig. 1.7 Espacio de número cuántico bidimensional. Supóngase que E m corresponde a un estado cuyos números cuánticos son n x = 15 y n y = 1 . Entonces tendremos
(n
2 x
+ ny
2
)
(
)
= 152 + 12 = 226
máx
En la figura 1.7, se ha trazado un cuadrante de círculo con su radio.
(n
r=
2 x
+ ny
2
)
máx
= 226
Todos los puntos que quedan dentro de este arco representan estados cuánticos con energías por debajo de E m . Así, considérese el estado con números cuánticos n x = 11 y n y = 10 . 2
2
Aquí, n x + n y = 221 que es menor que 226. Cuando se cuenta el número de puntos (estados) dentro del área dada, se prueba que son 163. Este mismo número se puede estimar calculando simplemente el área encerrada por el cuadrante de círculo (OAB). Esto es
Área =
π
4
r 2 máx =
π
4
(226) = 177 estados
______________________________________________________________________ 13 P.D-S
Este último valor, aunque difiere del valor contado de 163 estados, es una buena aproximación. La concordancia entre valores contados y calculados será mucho más ajustada cuando sea más grande el número total de estados, y para números muy grandes de estados (correspondiendo a valores muy grandes de E m ) puede predecirse el número de estados con un grado de exactitud elevado por medio de este tipo de cálculo. Así, para grandes valores de E m
η=
( n 4
π
2 x
+ ny
2
)
máx
=
π 8mL2 4 h
2
Em
en donde ηes el número de estados con una energía igual o menor que E m .
Fig. 1.8 A cero absoluto, puede suponerse que los estados ocupados quedan dentro de esta octante de esfera en el espacio de número cuántico. Volvamos a una consideración de un metal con tres dimensiones. Aquí, todos los estados con una energía menor de E m quedan dentro del octante de una esfera, como se define en la figura 1.8. Para grandes valores de E m , por analogía con el caso bidimensional, podemos tomar el volumen de esta octante como una medida del número de estados cuánticos con una energía igual o menor que E m . El radio de la esfera es:
(
2
2
rmáx = n x + n y + n z
)
2 1/ 2
8mL2 = 2 E m h
1/ 2
y por lo tanto, tenemos
1 4π π 8mL2 3 rmáx = 2 E m η= volumen del octante = 4 3 6 h
3/ 2
donde ηes el número de estados con una energía igual o menor que E m . ______________________________________________________________________ 14 P.D-S
Si N es el número de electrones en una pieza de metal, entonces a cero absoluto deben estar N/2 estados cuánticos llenos; o
N π 8mL2 = 2 E F 2 6 h
3/ 2
En esta expresión, E F , conocida como la energía de Fermi, es la máxima energía electrónica a cero absoluto. Resolviendo la relación anterior para la energía de Fermi, tendremos:
h2 EF = 8mL2
3N π
3/ 2
o
h2 3N EF = 8m πL3
2/3
h2 3 N = 8m π V
2/3
en donde V = L3 es el volumen de la supuesta caja de metal. Este último resultado es de interés porque muestra que la energía de Fermi depende sólo del número de electrones por unidad de volumen en el metal. Con la ayuda de la ecuación anterior, es posible estimar la energía de Fermi de un metal. Como un ejemplo, considérese la plata (Ag), la cual tiene un volumen molecular por gramo de 10,28 cm3. Como la plata es monovalente, una molécula gramo debe contener 6,02×1023 electrones libres. Además, la constante h de Planck es 6,63×10-27 erg/seg, y m , la masa del electrón, es 9,11×10-28gr. Sustituyendo estos valores en la ecuación nos da
(6,63 × 10 ) 3 ⋅ 6,02 × 10 = 10,28 8(9,11 × 10 ) π −27 2
2/3
EF − 28 E F = 8,9 × 10 −12 erg = 5,5 electrón − voltios 23
Es posible que se pueda expresar mejor esta energía en calorías por molécula de electrones (al nivel de Fermi) porque entonces podremos compararla con la energía atómica térmica. Así,
cal 8,9 × 10 −12 × 6,02 × 10 23 EF = = 130 . 000 mol 4,19 × 107 Esta energía es extremadamente elevada. Puede demostrarse fácilmente que el electrón promedio en un metal al cero absoluto posee energía que es 3/5 del valor de Fermi, de manera que en la Plata
EF =
3 (130.000) = 78.000 cal 5 mol
En cierto sentido, podemos pensar de los electrones en un metal como un gas. La energía térmica (cinética) de una molécula de un gas monoatómico, por ejemplo helio, de acuerdo ______________________________________________________________________ 15 P.D-S
con la teoría clásica, es del orden de 3/2 RT cal/mol. Puesto que R es aproximadamente 2 cal/mol/grado, a temperatura ambiente (T = 300 K) la energía térmica de tal gas deberá ser de unos 900 cal/mol. Puede verse entonces que los átomos de un gas ordinario poseen, a temperatura ambiente, sólo alrededor del 1/80 de la energía cinética principal de los electrones en un metal al cero absoluto.
Fig. 1.9 Relaciones de energía de acuerdo con la teoría de Sommerfeld. La teoría de Sommerfeld enuncia que los electrones en un metal se mueven a velocidades extremadamente elevadas y que ocupan niveles de energía definidos con dos electrones de movimiento opuesto en cada estado. Al cero absoluto, los electrones llenan todos los estados inferiores que quedan hasta un nivel conocido como nivel de Fermi. En la figura 1.9 se ilustran estas aseveraciones. En esta figura, V8 representa la diferencia en potencial entre un punto dentro del metal y un punto fuera del metal en el vacío. En nuestra derivación previa, se supuso que esta diferencia potencial era infinita, pero en un metal real es limitada. La suposición simplificada que se hizo, sin embargo, no afecta a nuestros resultados finales. Suponiendo que el potencial en el metales cero, el espacio alrededor del metal queda a un potencial que es más elevado en una cantidad V8. Por lo tanto, puede considerarse que el volumen del metal se encuentra en un pozo potencial. Puede pensarse que los estados de energía electrónica, quedan a diversas distancias sobre el fondo del pozo. El estado de energía más elevado a cero absoluto, o nivel de Fermi, se designa en la figura como E F . El promedio de energía queda a 3 / 5 E F . Finalmente, el símbolo φ representa la energía requerida para remover un electrón desde el nivel de Fermi y sacarlo del metal. Esto se llama la función de trabajo y es igual a la energía que se mide normalmente cuando se quita un electrón de la superficie de un metal (cuando se extrapola a 0 K). Obsérvese que , a 0 K. Un electrón en el nivel de Fermi posee la energía más elevada de todos los electrones en el metal y es más fácil de remover. El valor de la función de trabajo, determinado experimentalmente, para la plata es de 46,6 electrón-voltios. La energía de Fermi de la plata es de 5,5 electrón-voltios. Así, la diferencia en potencial V8 entre un punto dentro y un punto fuera del metal es alrededor de 10 electrón-voltios.
______________________________________________________________________ 16 P.D-S
1.4.
La densidad de estados
Es conveniente con frecuencia, pensando sobre los estados de energía en un metal, utilizar el concepto de densidad de estados. Para cualquier valor dado de la energía E, el número de estados con una energía igual o menor que este valor es
η=
π 8mL2 6 h 2
E
3/ 2
Debido a que es muy grande el número de estados en un metal, debemos considerar que tanto ηcomo E son funciones continuas, a pesar de que ellas varían con intervalos distintos. Con esta suposición, tomaremos la derivativa de ηcon respecto a E, lo cual nos da una nueva función N(E) donde
dη π 8mL2 N (E) = = E dE 4 h 2
3/ 2
Aquí, N(E) es la densidad de los estados de energía a un nivel de energía dado; el número de estados de energía con una energía de entre E y E + dE es N ( E )dE . La figura 1.10 muestra a N(E) graficada como una función de la energía de E. La curva resultante es una parábola. El área bajo esta parábola, comenzando en el origen y corriendo hacia un valor de energía E dado, representa el número de estados con una energía igual o menor que la de Fermi. Por definición de la energía de Fermi, esta área, por consiguiente, mide el número de estados que son ocupados por los electrones al cero absoluto. Por tanto, puede considerarse que la figura 8.10 muestra la naturaleza de la distribución de los electrones en los diversos niveles de energía a 0 K, de acuerdo con la teoría de Sommerfeld.
Fig. 1.10 Densidad de los estados como una función de la energía a 0ºK, de acuerdo con la teoría del electrón libre.
1.5.
El efecto de la temperatura sobre la distribución de electrones en los niveles de energía
La figura 8.10 puede tomarse para representar la distribución de los electrones en los diversos niveles de energía a 0 K. La cuestión que se nos presenta ahora es en qué forma es afectada esta distribución por un aumento en la temperatura significa que los átomos de un sólido vibran con amplitudes más grandes. La energía asociada con estas vibraciones aumentadas puede pasar de un lado a otro entre electrones libres y átomos vibratorios. La magnitud de la energía que puede ser dada a un electrón promedio por un ______________________________________________________________________ 17 P.D-S
átomo vibratorio es aproximadamente kT ( RT por mol de electrones), k es la constante de Boltzmann 1,38×10-16 erg/K. A temperatura ambiente, kT es alrededor de 4×10-14 erg. Sin embargo, hemos visto que en un metal típico (plata) E F es alrededor de 9×10-12erg. En esta forma, las vibraciones térmicas son capaces de cambiar la energía de los electrones por valores del orden de 1/200 de la energía de nivel de Fermi. Este es un hecho importante cuando se considera en unión de principio de exclusión de Pauli. Este último puede ser interpretado como una prohibición dl movimiento de un electrón desde un estado a otro que ya está lleno. En otras palabras, la energía térmica no puede tomar a un electrón en uno de los estados inferiores y elevarlo a otro nivel que ya está ocupado. Debido al pequeño tamaño de kT en relación con E F . Esto quiere decir que sólo pueden ser afectados por la energía térmica de los átomos los electrones que quedan en niveles de energía cercanos al nivel de Fermi. De acuerdo con las estadísticas Fermi-Dirac, puede suponerse que la distribución en los estados de energía a cualquier temperatura (T) es como se muestra en la figura 1.11. Aquí, se puede observar que algunos estados
Fig. 1.11 La energía térmica, a cualquier temperatura normal, sólo cambia ligeramente la distribución de los electrones en los estados de energía. Sobre E F están ocupados y un número correspondiente por debajo de E F están desocupados. Esta, por supuesto, es una distribución estadística, con los electrones moviéndose hacia dentro y hacia fuera de los estados que quedan cerca de E F . El cambio en la distribución de los electrones en los niveles de energía sólo es apreciable sobre un rango de varios valores de kT por encima y por debajo de E F . La energía de Fermi se define con mayor propiedad en los términos de la figura 1.11. Nosotros la hemos definido como la energía máxima de un electrón al cero absoluto. Con mayor propiedad, debería ser la energía del nivel, a cualquier temperatura, que contenga un 50% de probabilidad de ser ocupada por un electrón. Así, en la figura 1.11, la energía de Fermi corresponde a la energía donde la densidad de estados real (línea ab) tiene un valor igual a la mitad de la densidad de estados máxima (línea ac).
1.6.
Calor específico electrónico
Debido a que la energía térmica afecta a sólo unos relativamente pocos electrones, éstos proporcionan únicamente una pequeña contribución al calor específico de un metal. En consecuencia, según se calienta un metal, la mayoría de la energía utilizada en elevar la temperatura de éste va a incrementar la energía vibracional de los átomos. De hecho, el calor específico de los metales se puede calcular con exactitud razonable sobre la ______________________________________________________________________ 18 P.D-S
suposición de que el calor específico depende únicamente de las vibraciones atómicas. Uno de los éxitos de la teoría del electrón libre es su capacidad para explicar por qué es tan pequeña la contribución electrónica al calor específico.
1.7.
La teoría de la zona
En la simple teoría del electrón libre se supone que los electrones se mueven en una región de potencial constante. Realmente, sin embargo, dentro de cualquier metal real hay una disposición periódica de iones cargados positivamente a través del cuál deben trasladarse los electrones (figura 1.12). En consecuencia, el potencial a lo largo de una línea tal como aa, la cual pasa a través de los centros de los iones, debe variar en la forma representada en la figura 1.13. Bloch♣ fue el primero en desarrollar un tratamiento mecánico ondulatorio del movimiento de los electrones en un potencial periódico.
Fig. 1.12 Los electrones no pueden moverse a través de la red se satisface la ley de Bragg: nλ = 2dsenθ
Fig. 1.13 Potencial periódico dentro de un cristal
♣
Bloch, F., Zeits. Für Physik, 52 (1928), pág. 555; 59 (1930), pág. 208
______________________________________________________________________ 19 P.D-S
Como este análisis es demasiado complicado para que lo consideremos, nos ocuparemos únicamente de ciertas conclusiones importantes de este análisis. Una de las conclusiones más importantes es que no puede producirse el movimiento de los electrones en un cristal bajo las condiciones que satisfagan la ley de difracción de Bragg.
nλ = 2dsenθ
en donde n es un entero, λ es la longitud de la onda de los electrones, d es el espaciamiento interplanar, y θ el ángulo de incidencia de los electrones relativos al plano reticular dado. Así, en la figura 1.12 aa representa un plano reticular y θ es el ángulo entre la dirección de movimiento de los electrones y este plano, un electrón es incapaz de moverse a través del cristal en la dirección indicada cuando λ = 2dsen(θ / n ) . El hecho de que los electrones no se pueden mover en el interior de un cristal en forma tal que satisfagan la ley de Bragg no es sorprendente. La relación de Bragg nos dice meramente las condiciones bajo las cuales son reflectados los electrones por los planos de un cristal. Así es que, los electrones moviéndose en direcciones específicas y con determinadas energías, son capaces de ser reflectados desde su dirección de movimiento original. Generalmente, esto se puede interpretar como que los electrones no son capaces de poseer las energías y direcciones de movimiento que producen reflexiones internas. Por lo tanto, la ley Bragg tiene un efecto importante sobre los estados de energía que un electrón puede poseer en un metal. Nuestro propósito presente es desarrollar estas relaciones, pero primero debe considerarse en mayor detalle la ley de Bragg. La longitud de onda de un electrón se relaciona con su momento por la ecuación
h h = mv p
λ=
o sustituyendo el momentun por la longitud de onda en la ley de Bragg, tenemos
p=
nh 2dsenθ
Esta aseveración de la ley de Bragg nos dice que las reflexiones de electrones ocurrirán a ciertas combinaciones de una dirección de movimiento y magnitud del momento del electrón, esto es, a valores específicos del vector de momento de un electrón. En la mecánica ondulatoria es costumbre utilizar el número de onda k en lugar del momentun p para describir los resultados del presente tipo de trabajo; los dos vectores difieren únicamente por una constante 2π / h , o
k=
2πp h
Cuando se expresa en términos del número de onda k, la relación de Bragg se convierte en
k=
πp
dsenθ
Recalquemos que k es un vector cuya dirección es la misma que la del movimiento del electrón, y cuya magnitud es directamente proporcional al momento del electrón. Reacomodando la ecuación anterior nos da ______________________________________________________________________ 20 P.D-S
ksenθ =
πp d
Sin embargo, la cantidad ksenθ es meramente la componente del vector del número de onda normal al plano reflectante de Bragg, como se muestra en la figura 1.14 para n = 1 (reflexión de primer orden). La expresión anterior nos dice que , siempre que la componente de k resulta normal plano reticular sea igual a nπ / d , serán satisfechas las condiciones de Bragg. Como los valores críticos de esta componente normal al número de onda k varían inversamente con el espaciamiento interplanar d, es evidente que los primeros planos que influirán sobre el movimiento de los electrones serán aquellos con mayores valores de d: planos con los índices de Miller más bajos.
Fig. 1.14 L primera reflexión de Bragg ocurre cuando k ·senθ = π / d , o cuando la componente de k normal al plano de reflexión es una constante ( π / d ) . En la figura se muestran dos valores diferentes de λ que satisfacen la condición de Bragg Ahora consideremos un ejemplo de una red cúbica simple de dos dimensiones, como se muestra en la figura 1.15. La condición de Bragg se satisface primero por los planos {100}de esta red. Los electrones que ocupan estados de energía muy bajos, con los correspondientes valores de k muy pequeños, serán capaces, en general, de moverse en cualquier dirección a través del cristal sin reflexión.
Fig. 1.15 Una red cúbica simple.
______________________________________________________________________ 21 P.D-S
Sin embargo, según consideramos a los electrones en estados de energía cada vez más elevados, se alcanza eventualmente un punto donde la condición de Bragg con respecto a los planos {100} influye el movimiento de los electrones. Después de esto, el segundo juego de planos para los cuales será satisfecha la condición de Bragg es {100}, los segundos planos más ampliamente espaciados en la estructuras cúbica simple. Investiguemos ahora específicamente las reflexiones desde los planos {100} con un poco más detalle. La figura 1.16A representa un sistema de coordenadas el cual se denominará espacio k. Cualquier punto, tal como m en esta figura, corresponde a un vector de número de onda específico. La figura 1.16B muestra que el vector en cuestión puede obtenerse trazando una flecha desde el origen de coordenadas al punto dado, y que si llamamos a este vector k su componente x será kx y su componente y será ky. En una red bidimensional
Fig. 1.16 Espacio de número de onda bidimensional. El punto m en (A) representa el vector k en (B). como la de la figura 1.15, hay dos planos {100} –horizontal (010) y vertical (100). La condición de Bragg se satisface para estos dos tipos de planos por todos los vectores k correspondientes a la línea ABCD en la figura 1.5. A este respecto, considérese el vector arbitrario k’ que corre desde el origen del sistema de coordenadas espaciales k hasta un punto sobre la línea AB. Este vector forma un ángulo θ’ con la horizontal y así también con los planos (010) en la figura 8.17. De acuerdo con este dibujo, la componente vertical de este vector, que es normal a los planos (010), es π/d. El vector k’ satisface en esta forma la condición de Bragg con respecto a los planos (010) y lo mismo puede decirse de todos los valores de k que caen sobre la línea AB y sobre la línea CD. Además, puede verse que el vector k’’, que termina sobre la línea BC, satisface la condición de Bragg para los planos (100). Por consiguiente, las líneas AB y DC representan vectores k para reflexiones desde los planos horizontales, y las líneas BC y AD los de los planos verticales. Todos los vectores tales como k’ y k’’ que tocan ABCD representan números de onda que satisfacen la condición de Bragg. Por otra parte, cualquier vector tal como k’’’ que no se extienda hasta el límite ABCD representa el movimiento de un electrón que no sufre reflexión. El área en el espacio del número de onda encerrado por la línea ABCD se conoce como una ______________________________________________________________________ 22 P.D-S
zona de Brillouin. En el caso de la red cúbica simple bidimensional considerada ahora, ABCD es la primera zona. La segunda está formada por las reflexiones desde los planos {100}, y se muestra en unión de la primera zona en la figura 8.18. Los límites exteriores de la segunda zona se dan por las líneas que conectan a los puntos E, F, G, y H. La zona misma está representada por las cuatro zonas triangulares sombreadas. Una propiedad interesante de las áreas de Brillouin es que las diferentes zonas para un cristal dado tienen todas la misma área. Así, las áreas de las zonas uno y dos en la figura 1.18 son iguales. La segunda zona tiene la misma importancia que la primera. Cualquier vector k que caiga sobre el límite de esta zona corresponde a una reflexión y a un tipo de movimiento de los electrones imposible.
Fig. 1.17 La primera zona de Brillouin de una red cúbica simple bidimensional. En tres dimensiones, la primera zona de Brillouin de una red cúbica simple es un cubo (figura 1.19). Las caras de este cubo son paralelas a los planos del cubo {100} y representan valores críticos del vector del número de onda en tres dimensiones. Las zonas Brillouin de las formas de red regular, en la que cristalizan normalmente los metales, se pueden deducir fácilmente de la misma manera que para la red cúbica simple. En el sistema cúbico centrado en las caras, por ejemplo, resulta que en ciertas direcciones desde planos {111}. La primera zona de Brillouin de esta red, la cual aparece en la figura 1.20, se forma, por lo tanto, desde superficies paralelas a ambos tipos de estos planos.
1.8. La dependencia de la energía sobre el número de onda De acuerdo con la teoría de Sommerfeld, la energía de un electrón está relacionada con el número de onda k del electrón por la ecuación
h2k 2 E= 8π 2 m ______________________________________________________________________ 23 P.D-S
en donde E es la energía del electrón, m es su masa, k es su número de onda y h es la constante de Planck.
Fig. 1.18 Primera y segunda zonas de Brillouin de una red cúbica simple. La segunda zona está sombreada.
Fig. 1.19 Primera zona de Brillouin de una red cúbica simple tridimensional.
______________________________________________________________________ 24 P.D-S
Ahora limitemos atención a los electrones que viajan sólo en una dirección, digamos, paralela al eje x y por tanto normal a los planos (100). El número de ondas de tales electrones se representa por el símbolo k, y tenemos que 2
h2k x E= 2 8π m Esta relación parabólica entre la energía y el número de onda se muestra en la forma diagramática de la figura 1.21, y está basada en la suposición de Sommerfeld de que los electrones se mueven en un potencial constante. Cuando consideramos los movimientos de los electrones en un potencial periódico, la figura 1.21 representa todavía una buena aproximación de la relación número de onda-energía sobre la mayoría del espectro energético. Sin embargo, según acabamos de ver, a ciertos valores críticos del número de onda se rompe el movimiento normal del electrón, lo cual tiene el efecto de introducir discontinuidades dentro de la curva número de onda-energía. Así, para electrones que viajan normales a planos (100), tenemos
kx = ±
nπ dsen(θ )
pero aquí θ es 90º por lo tanto el senθ = 1, de manera que kx = nπ/d, donde n es un número entero y d es el espaciamiento interplanar de los planos (100). Por consiguiente, las discontinuidades en la relación número de onda-energía ocurren a intervalos de π/d a lo largo del eje kx, como se muestra en la figura 8.22. Obsérvese que según se acerca k a un múltiplo de π/d, la energía se desvía desde la parábola simple mostrada en la figura 1.21.
Fig. 1.20 Primera zona de Brillouin de una red cúbica centrada en las caras. Las superficies son paralelas bien a {100} o {111}.
______________________________________________________________________ 25 P.D-S
En particular, considérese una discontinuidad específica tal como en π/d. Aquí, según kx se acerca a un valor crítico desde cualquier dirección, comienza a cambiar la energía con lentitud cada vez mayor, de tal manera que la curva representa al estado de energía tiende a volverse y a correr paralela a kx o eje del número de onda. Al valor específico π/d, la energía tiene dos valores representados por los puntos a y b, respectivamente, en la figura 1.22. Los electrones que viajan normales a los planos (100) no pueden tener energía que caiga entre el intervalo de a y b.
Fig. 1.21 Energía de un electrón (moviéndose en una sola dirección) graficada como una función de su número de onda de acuerdo con la teoría del electrón libre.
Fig. 1.22 Variación de la energía con el número de onda de los electrones moviéndose en una sola dirección de acuerdo con la teoría de zona.
______________________________________________________________________ 26 P.D-S
Ahora nos referiremos a otro diagrama que muestra la primera zona de Brillouin de una red cúbica simple bidimensional -figura 1.23(A). En el último diagrama, se han colocado dos puntos marcados a y b a lo largo del eje kx. Estos puntos corresponden a puntos similares en la figura 1.22, y se destinan para mostrar que cuando se cruza el límite de una zona de Brillouin, ocurre una discontinuidad en los niveles de energía. Tales discontinuidades ocurren sin importar dónde se cruza la zona de Brillouin. Sin embargo, la posición de la abertura en la energía, como puede verse en la gráfica de la energía en función del número de onda, varía con la dirección de movimiento del electrón en el cristal, y por lo tanto varía con el punto donde se cruza el límite de la zona. Esto se debe a la magnitud absoluta de los cambios críticos del número de onda, según nos movemos a lo largo del límite de zona.
Fig. 1.23 La abertura de la energía varía con la dirección del movimiento de los electrones. (Nótese que sólo se muestra la mitad positiva de la parábola del número de onda-energía) Así, en la figura 1.23A, un vector crítico del número de onda tal como k1, que es paralelo a uno de los ejes principales del cristal, 〈100〉, corresponde al valor menor del número de onda al cual serán reflectados los electrones en la red cúbica simple bidimensional bajo consideración. Todos los demás números de onda críticos para la primera zona son mayores que k1 como, por ejemplo, k2 y k3, los cuales corresponden a los electrones que se mueven en oras direcciones que las normales al plano {100}. En efecto, se ve fácilmente que k3 representa al número de onda crítico, por tanto, aumenta desde un valor mínimo en el ______________________________________________________________________ 27 P.D-S
centro de no de los lados de la zona bidimensional hasta un valor máximo en las esquinas de las zona. Correspondiendo a este cambio en el valor del número de onda a lo largo del límite de una zona hay un cambio en la posición de la abertura en la energía, como se muestra en la figura 1.23B, donde se grafica la energía como una función del número de onda para las tres posiciones indicadas donde se cruza el límite de la zona. Obsérvese, sin embargo, que en cada caso sólo se da la mitad de la curva número de onda-energía. Estas curvas muestran claramente la forma en que cambia la posición de la abertura en la energía según se varía la dirección del movimiento del electrón. Las aberturas en la energía se producen a los valores energéticos más bajos, cuando los electrones se mueven en una dirección normal a los planos {100}, y a los valores más altos cuando los electrones viajan a 45º en relación a estos planos. Como se mencionó previamente, la zona de Brillouin de una red cúbica simple en tres dimensiones es un cubo. Aquí, puede demostrarse también que las aberturas en la energía ocurrirán a los menores valores de k cuando los electrones se mueven en una dirección 〈100〉. Sin embargo, los valores máximos de k para el cruce de la primera zona de Brillouin, en este caso, ocurrirán en las esquinas del cubo las que, en tres dimensiones, corresponden a los electrones moviéndose en las direcciones 〈111〉.
1.9. La densidad de la curva de estados Debido a que los límites de una zona de Brillouin representan una abertura en los niveles de energía permitidos para todas las direcciones de movimiento de los electrones, puede concluirse que el número de niveles de energía dentro de una zona dad es finito o limitado. A este respecto, puede mostrarse realmente♣ que el número de estados de energía tanto en un metal cúbico centrado en el cuerpo como uno centrado en las caras es exactamente igual al número de átomos en el metal. Por el Principio de Pauli, cada zona de estos metales cúbicos deberá, en consecuencia ser capaz de contener el doble de electrones que átomos hay en el metal. En metales monovalentes, por ejemplo, oro, plata y cobre, hay, en consecuencia, justamente los electrones de valencia suficientes para llenar la mitad de la primera zona. Como resultado del hecho de que hay un número definido de niveles de energía en una zona dada y de que hay aberturas en la energía entre zonas, no se puede mantener la simple relación parabólica entre la densidad de estados en un metal y la energía de estados en un metal cuando se considera la existencia de las zonas. En la fig. 1.24A se muestra la ley parabólica pronosticada por Sommerfeld. En la fig. 1.24B se muestra la curva correspondiente, de acuerdo con la teoría de zona. La última curva se refiere específicamente sólo a la primera de una red cúbica simple bidimensional, pero puede tomarse como representativa de la naturaleza de la forma de la curva de densidades de estados como una función de energía para los otros cristales más complejos. El área bajo esta curva representa el número total de estados de energía en toda la primera zona. Esta curva tiene varios puntos de interés. Primero, para pequeños valores de energía, la curva de la teoría de zona es idéntica a la relación parabólica de la teoría del electrón libre. Segundo, según aumenta la energía de estados, se alcanza eventualmente un punto donde los electrones viajando en direcciones 〈100〉 comienzan aparecer las reflexiones de Bragg desde los planos {100}. En este momento, aumenta la densidad de los estados y la curva ♣
Raynor, G. V., An Introduction to the Electron Theory of Metals. Instituto de los Metales, Londres, 1947.
______________________________________________________________________ 28 P.D-S
asciende sobre la relación parabólica simple. Sin embargo, por aumentos posteriores en la energía, la densidad de los estados disminuye y eventualmente desciende a cero. Este último efecto se debe al hecho de que, según aumenta la energía, disminuye el número de estados remanentes en la zona.
Fig. 1.24 La densidad de estados como una función de la energía (A) de acuerdo a la teoría del electrón libre. (B) la teoría de zona.
1.10.
Conductores y aisladores
Ahora estamos en una posición donde podemos aplicar los principios de la teoría de zonas para explicar las diferencias entre varios de los sólidos bien conocidos. Consideremos primero el caso donde la abertura de energía entre las zonas primera y segunda es lo suficientemente grande para que no haya sobreposición de los niveles de energía en las dos primeras zonas. Con el propósito de ilustrar nuestro punto, utilicemos una vez más el caso de la red cúbica simple bidimensional y, además, supongamos que las curvas número de ondaenergía correspondientes a las posiciones inferior y superior de las aberturas de energía son como se muestran en la fig. 1.25A. Aquí, debido al gran tamaño de la abertura en cualquier dirección específica, el nivel de energía en el fondo de la segunda zona queda muy por encima del nivel de energía superior de la primera zona. Los niveles de energía en la zona segunda son todos considerablemente más altos que los de la zona primera, y de ordinario, un electrón no será capaz de penetrar a la zona segunda a menos de que reciba una energía de excitación relativamente grande. Generalmente, puede suponerse que la energía necesaria es mucho más elevada, puesto que es del orden de varios electrón-voltios, que serían suministrados generalmente por vibraciones térmicas a cualquier temperatura normal. Esta condición se debe al hecho de que kT es aproximadamente 1/40 electrónvoltios (temperatura ambiente). En la fig. 1.25B, se muestra además un método alternativo para describir la relación del nivel de energía con respecto a las dos zonas. Aquí, la densidad de estados en función de la energía se grafica para las dos zonas primeras, y se muestra claramente la separación entre las dos zonas.
______________________________________________________________________ 29 P.D-S
Ahora, supongamos que estamos interesaos en un metal monovalente y que cada una de las zonas indicadas es capaz de mantener, a lo sumo, dos electrones por átomo. Como
Fig. 1.25 Cuando la abertura de la energía para los electrones que se mueven en una sola dirección es grande (como en [A]), puede resultar una abertura en los niveles de energía entre las zonas (como en [B]) los átomos del metal sólo contienen un electrón de valencia simple por átomo. Como los átomos del metal sólo contienen un electrón de valencia simple por átomo, únicamente hay electrones suficientes para llenar la mitad de la zona primera. Al cero absoluto puede suponerse que los electrones ocuparán la mitad del fondo de los niveles energéticos de la zona primera. Esto se da a entender en la fig. 1.25B, donde está sombreada la mitad inferior del área, representando los estados de energía llenos. Cuando una zona sólo está llena parcialmente, como se muestra en la fig. 1.25, el sólido es un metal normal o conductor eléctrico. Para que una corriente eléctrica pueda moverse dentro de un sólido, los electrones deben ser capaces de moverse dentro de los niveles de energía más altos. Este es ciertamente el caso en el ejemplo presente donde están desocupados la mitad de los niveles de energía y cualquier potencial eléctrico aplicado puede ocasionar que se aceleren los electrones dentro de niveles de energía más altos. También podemos visualizar la zona parcialmente llena de un conductor metálico en la forma de la fig. 1.26A, donde el área circular en el centro de la zona de Brillouin representa todos los estados de energía llenos. El significado de esta área es como sigue. ______________________________________________________________________ 30 P.D-S
Recordando que estamos tratando con un ejemplo bidimensional, el círculo muestra que los electrones poseen todos los valores posibles de k hasta km que corresponden al radio del círculo y al nivel de Fermi. Como la dirección de un vector k es la misma que la dirección de movimiento de un electrón, la simetría de la distribución de los valores de k significa
Fig. 1.26 Efecto de un campo eléctrico sobre la distribución de estados de energía en la primera zona de Brillouin (red cúbica simple bidimensional) que los electrones se mueven en todas direcciones en tal forma que no hay un flujo neto de carga. Ahora supongamos que se aplica un campo eléctrico sobre nuestro metal bidimensional. El efecto de este campo será acelerar algunos de estos electrones y moverlos dentro de los niveles de energía más altos en la dirección del campo. Así, si se supone que del campo es dirigido en la dirección positiva del eje x, los electrones con vectores de onda que queden al lado derecho de la fig. 1.26A se moverán hacia niveles de energía con componentes más grandes de k en la dirección x, como se muestra en la figura 1.26B. Los estados que desocupan estos electrones se llenarán, a su vez, por electrones en los estados con valore de k justamente inferiores al grupo primero. Este proceso de promoción de electrones dentro de los estados de energía con valores de kx más grandes, puede considerarse que se extiende por toda la distribución, en la forma mostrada en la fig. 1.26B. Lo que sucede efectivamente es que el círculo se mueve hacia la derecha. En esta nueva disposición, para cada electrón con un valor de k aumentando en la dirección del campo (sobre la derecha del círculo) hay otro con n valor menguado (sobre la izquierda del círculo). Esta distribución no simétrica de velocidades de electrones resulta en un flujo neto de carga en dirección del campo y constituye una corriente eléctrica. Considérese ahora un sólido que contiene justamente los electrones suficientes para llenar completamente la primera banda. En el ejemplo presente, este podría ser dos electrones por átomo. Aquí, si todavía suponemos una amplia separación entre los niveles de energía de la primera banda y los de la segunda, el sólido constituye un aislador. Los ______________________________________________________________________ 31 P.D-S
electrones no se pueden mover dentro de los niveles de energía más altos en la primera banda porque todos los estados están llenos. Además, ningún potencial eléctrico normal es capaz de elevarlos a través de la abertura en la energía desde la primera zona a la segunda. Si no es posible cambiar los estados de energía de los electrones, no será posible entonces cambiar la velocidad promedio de los electrones, por lo tanto, no puede haber corriente eléctrica neta. La simple explicación anterior muestra que la teoría electrónica, que se fundó en el concepto de electrones libres en un metal, también es capaz de explicar por qué ciertos sólidos son aisladores. Estos materiales son, en general, los que poseen electrones que llenan completamente una zona de Brillouin y, al mismo tiempo, tienen amplias aberturas en la energía entre las zonas llenas y las zonas que quedan directamente sobre ellas. Un excelente ejemplo lo proporciona la forma de diamante del carbono que tiene cuatro electrones de valencia por átomo en cada celda. Este es justamente el número de electrones de valencia necesarios para llenar completamente la primera zona en la estructura del diamante. Como hay una considerable abertura en la energía entre las zonas primera y segunda, el diamante es aislador. Cuando un sólido contiene electrones suficientes para llenar por completo una zona de Brillouin, puede poseer las propiedades de un conductor metálico provisto que haya una sobre posición de zonas. Esta sobre posición pude ser explicada con la ayuda de la fig. 1.27A, la cual muestra de nuevo las curvas número de onda-energía para diferentes direcciones de movimiento en un cristal cúbico simple bidimensional. En el caso presente, se supone que la abertura en la energía para electrones que se mueven en una dirección dada es pequeña, y que los estados en la parte superior de a primera zona tienen energía más alta que la de los estados del fondo de la segunda zona. La fig. 1.27B muestra las zonas correspondientes trazadas sobre un diagrama de densidad de estados. En esta figura, la línea de puntos que queda sobre la región donde se sobreponen las zonas representa la suma de las curvas de densidad individual. Supongamos ahora, que hay electrones suficientes para llenar la primera zona. Debido al solapamiento en los niveles de energía algunos de los electrones pasarán a la segunda zona, resultando que ambas zonas estarán llenas al mismo nivel de energía. Esto se muestra en la fig. 1.37, donde el área sombrada indica los estados llenos. Es posible la conducción eléctrica en un sólido del tipo indicado en la fig. 1.27 porque hay estados de energía desocupados en ambas zonas directamente sobre los electrones en el nivel de Fermi (estados llenos más altos). Otro hecho que debe ser mencionado es que los electrones pueden cambiarse fácilmente de una zona a la otra en este tipo de sólido. Un electrón que ocupa un nivel alto en la primera zona puede cambiarse a un estado de energía equivalente en la segunda zona, sin un gran cambio en energía, si sólo se cambia la dirección de su movimiento, esto es, desde [100] a [110]. Tales cambios en la dirección del movimiento pueden ser ocasionados fácilmente por el efecto dispersor de las vibraciones reticulares.
1.11.
Semiconductores
En la sección anterior, se mostró que los aisladores poseen zonas llenas separadas de las zonas desocupadas por aberturas en la energía relativamente grandes. Al mismo tiempo e indicó también que si las zonas se sobre imponen (abertura de energía cero) el ______________________________________________________________________ 32 P.D-S
sólido tiene las propiedades asociadas normalmente con un metal, aun cuando tiene electrones suficientes para llenar la primera zona. Los sólidos semiconductores representan un caso intermedio, uno entre estos dos tipos elementales. Los semiconductores tomarán dos formas básicas: intrínseca e impura.
Fig. 1.27 Zonas sobreimpuestas. Un semiconductor intrínseco, del cual nos ocuparemos primero, tiene la disposición de zona de un aislador típico, sólo la abertura en la energía es de menor magnitud que en un aislador típico. Así, refiriéndonos a la fig. 1.25, un semiconductor intrínseco tendrá una primera zona llena con una abertura angosta entre la primera zona y la segunda. Al cero absoluto esta clase de sólido tiene las propiedades de un aislador típico. Sin embargo, según se eleva la temperatura, la energía térmica permite que los electrones salten sobre la angosta abertura en la energía y entrar en la zona desocupada. Cuando esto sucede, el sólido se vuelve un débil conductor de electricidad. La habilidad de un semiconductor intrínseco para conducir corriente eléctrica depende de dos factores. Así, cada electrón que se mueve a la banda superior deja un estado energético vacante, o agujero, en la banda inferior, y la habilidad de un semiconductor para conducir la electricidad depende de los electrones que son elevados a la banda superior y de los agujeros dejados atrás en la banda inferior. Es evidente el hecho de que los electrones pueden conducir corriente cuando se les eleva a una zona de Brillouin que de otra forma estaría desocupada. La contribución de los agujeros a la corriente puede ser explicada en la forma siguiente. En general, cuando hay un estado desocupado en una zona que de otra forma estaría llena, este estado puede ser llenado casi a voluntad por electrones de energía casi igual en estados adyacentes. Sin embargo, cuando un electrón se mueve dentro de un estado desocupado, se forma el estado que deja dentro del estado desocupado. Ahora, cuando se ______________________________________________________________________ 33 P.D-S
aplica un campo eléctrico a esta forma de sólido, los movimientos sucesivos de los electrones dentro de los estados desocupados, son influidos por el campo aplicado. En general, el campo tiende a causar que los electrones se muevan dentro de los estados vacantes en una dirección tal que contribuya como un elemento de corriente en la dirección del campo aplicado. Sin embargo, para cada movimiento que hace un electrón dentro de un agujero en la dirección del campo aplicado, hay un movimiento inverso correspondiente del estado desocupado o agujero. Por lo tanto, es posible considerar a un agujero en el sentido de un conductor de carga positiva, porque se mueve en dirección opuesta a la del electrón cargado negativamente. Con frecuencia, se describe la contribución de los agujeros en la banda inferior a la conductividad de un semiconductor en términos del movimiento de estas ficticias partículas cargadas en forma positiva. En un semiconductor intrínseco, la conductividad aumenta con el aumento en la temperatura porque con ello aumenta el número de conductores de carga; el número de electrones que se mueven a la banda superior crece con el aumento de la temperatura. El número de electrones que son excitados térmicamente dentro de la banda superior, o banda de conducción como se les llama, varía aproximadamente con un factor de Boltzmann de la forma e − ∆E / kT , donde ∆E es el tamaño de la abertura de la energía y k es la constante de Boltzmann. Esta calse de realción funcional aparecerá en secciones posteriores de este libro en conexión con cierto número de otros fenómenos que ocurren en los metales. Por ahora es suficiente decir que representa una rápida elevación en a conductividad con la temperatura. Además, debe recordarse que en general las conductividades de los semiconductores son muy pequeños cuando se les compara con las conductividades de los metales. Solo si kT es del orden de ∆E podría esperarse que un semiconductor tenga una conductividad comparable a la de un metal normal, pues si suponemos que ∆E es alrededor de ½ electrónvoltio (un valor razonable para un semiconductor), se requiere una temperatura del orden de 6000 K para hacer kT igual a este valor de ∆E. Esta temperatura, sin embargo, es suficiente tanto para fundir como para vaporizar todos los elementos conocidos. Una característica interesante de los semiconductores intrínsecos es que su conductividad aumenta con el aumento de la temperatura. Esto es opuesto a la variación de la conductividad en los metales, donde el aumento en la temperatura decrece la conductividad. En el caso de conductores metálicos, una red perfecta no deberá ofrecer resistencia al movimiento de los electrones al cero absoluto. A una temperatura elevada, sin embargo, las vibraciones térmicas de la red cambian constantemente a los electrones de un estado a otro en los estados cercanos al nivel de Fermi. Esto tiene el efecto de tender a destruir el movimiento ordenado de los impartido por un campo eléctrico y conduce a una resistencia al flujo de la corriente eléctrica. Las vibraciones térmicas, en consecuencia, aumentan la resistencia de un metal, mientras que la hacen decrecer en un semiconductor.
1.12.
Semiconductores impuros
Al hablar de semiconductores, es práctica usual llamar a la banda inferior banda de valencia y a la superior banda de conducción. Los semiconductores impuros se caracterizan por tener niveles de energéticos discretos que quedan en la abertura de la energía entre la banda de valencia y la de conducción. Estos niveles energéticos están asociados a la presencia de átomos impuros en la red. Lo más importante de los semiconductores impuros son el silicio y el germanio. Ambos elementos pertenecen al mismo grupo en la tabla periódica que el carbono, y cristalizan en la red covalente del diamante. Como resultado, ______________________________________________________________________ 34 P.D-S
tienen una estructura de zona similar a la del diamante. Los tamaños en abertura respectivos son de alrededor de 0,74 electrón voltios para el germanio, 1.10 electrón voltios para el silicio, y 7 electrón voltios para el diamante. El diamante está calificado como aislador debido a su gran abertura energética, mientras que el tamaño moderado en las aberturas de las energías en el silicio y el germanio hace posible clasificar a estos elementos como semiconductores intrínsecos. A temperatura ambiente, sin embargo, su conductividad intrínseca es extremadamente baja y sólo se vuelve apreciable cuando se les calienta a temperatura de varios cientos de grados sobre el ambiente. En efecto, la conductividad asociada normalmente con estos elementos a temperatura ambiente puede considerarse como debida primordialmente a la presencia de átomos impuros en estos elementos.
Fig. 1.28 Niveles aceptantes en un semiconductor impuro. En total, hay cuatro elementos que cristalizan en la estructura de diamante: carbono (diamante), silicio, germanio y estaño (gris). Cada uno de estos elementos posee cuatro electrones de valencia. Hay dos formas de interpretar sus estructuras cristalinas. Primero, desde el punto de vista covalente, podemos suponer que cada átomo está enlazado a sus cuatro vecinos más cercanos por enlaces covalentes, correspondiendo cada enlace a un par de electrones compartidos. Alternativamente, de la teoría de zona, sabemos que los enlaces poseen suficientes electrones para llenar la primera zona y que en el diamante, silicio y germanio hay una abertura energética que separa la zona de valencia de la zona de conducción. Es interesante observar, sin embargo, la creencia de que estas zona se sobreponen en el estaño gris; un efecto que da a esta estructura las propiedades de un conductor metálico. Ahora consideremos específicamente los elementos silicio y germanio. Supóngase que un átomo con una valencia de tres (B, Al, Ga, In) es sustituido en el cristal de uno de estos elementos por uno de los átomos de silicio o del germanio. Se supone así que uno de los átomos impuros ocupa una de las posiciones de la red que normalmente sería ocupada tal vez por un átomo de silicio (o de germanio). Como el átomo impuro sólo contribuye al fig. 1.28. cristal con tres electrones de valencia, habrá un electrón menos en el sólido que el número requerido para dar a cada átomo cuatro pares de electrones compartidos. Como resultado, ______________________________________________________________________ 35 P.D-S
un enlace covalente sólido debe tener sólo un electrón de valencia simple. Partiendo del concepto de zona, esto tiene el efecto de crear un nivel energético más lato en la banda de valencia. La posición de este nivel energético relativo a la banda de valencia se muestra esquemáticamente en la fig. 1.28. La magnitud de la abertura en la energía entre la parte superior de la banda de valencia y este nivel desocupado, que generalmente se conoce como un nivel aceptante, se da en la tabla 1.2 para un número de elementos trivalentes. La tabla muestra que la magnitud de las aberturas es alrededor de 0.01 electrón voltios, la cual es del mismo orden que el valor de kT a temperatura ambiente alrededor de 1/40 electrón voltios. Como el último da una estimación de la energía que las vibraciones térmicas pueden impartir a un electrón, es evidente que la energía térmica puede rápidamente excitar electrones desde la banda de valencia dentro de los niveles aceptantes a temperatura ambiente. Cuando esto sucede, se deja un nivel de energía vacante o agujero detrás de la banda de valencia. Como los agujeros en la banda de valencia son capaces de conducir corrientes eléctricas, la excitación de electrones dentro de los niveles aceptantes da a los sólidos la habilidad para conducir corriente. Un semiconductor que exhibe conductividad causada por lo movimientos de los agujeros en la banda de valencia se denomina semiconductor tipo p, en el supuesto de que se considere a los agujeros como cargas positivas. Debe indicarse aquí un medio alternativo para que los átomos impuros puedan contribuir a las propiedades de semiconducción.
Fig. 1.29 Niveles donadores en un semiconductor impuro. Supóngase un átomo con 5 electrones de valencia (P, As, Sb, Bi) que es sustituido dentro de la red de un cristal de germanio o de silicio. En cualquiera de los casos, cada átomo impuro contribuirá con un electrón más de los necesarios para formar los cuatro enlaces covalentes por átomo en el sólido. Desde la zona o teoría de banda, este electrón extra quedará en un nivel energético que está muy por encima de los niveles asociados con la banda de valencia y que, en general, cae justamente debajo de la banda de conducción. En la fig. 1.29 se muestra la posición de estos niveles energéticos, donde se les designa como ______________________________________________________________________ 36 P.D-S
niveles donadores. En la tabla 1.2 se da la diferencia energética entre el fondo de la banda de conducción y los niveles donadores para alguno de los elementos con una valencia de cinco. Estas aberturas son comparables también al valor de kT a temperatura ambiente, de manera que podemos suponer que los electrones que ocuparían normalmente estos niveles TABLA 1.2 ABERTURAS DE LA ENERGÍA EN SEMICONDUCTORES IMPUROS* Impuro B Al Ga In
En el germanio 0.0104 0.0102 0.0108 0.0112
En el silicio 0.045 0.057 0.066 0.160
Abertura de la energía entre le nivel aceptante y la banda de valencia Abertura de la energía entre le nivel donador y la banda de conducción P As Sb
0.0120 0.0127 0.0096
0.044 0.049 0.039
son excitados en gran cantidad a temperatura ambiente dentro de los niveles de la banda de conducción. En la banda de conducción, los electrones excitados dan al material la habilidad de conducir una corriente eléctrica. Los semiconductores, con habilidades conductoras de corriente debidas primordialmente a la presencia de electrones excitados desde niveles donadores dentro de la banda de conducción, se conocen como de tipo n, o semiconductores negativos.
______________________________________________________________________ 37 P.D-S
Referencias Bibliográficas Principios de metalurgia física / por Robert E. Reed-Hill ; [tr. por Antonio Galán Patiño]. México, D.F.: C.E.C.S.A., 1979.
______________________________________________________________________ 38 P.D-S
2. Estructura Electrónica de los átomos 2.1. Introducción Los progresos de la física y de la química en los últimos cien años han demostrado que las propiedades dependen de su Estructura Interna (un todo estructurado es un conjunto formado por partes ordenadas). Para la comprensión de las propiedades corrientemente interesantes en Ingeniería (salvo en Ingeniería Nuclear), basta considerar a la materia formada por átomos y a éstos constituidos por electrones en torno a un núcleo de protones y neutrones. En los átomos libres y no excitados de cualquier elemento, el número de electrones es idéntico al número de protones; a tal valor se le llama el número atómico, Z. La carga del electrón es negativa en tanto que la del protón es positiva y la del neutrón es nula; en valor absoluto, la carga del protón y del electrón son idénticas. Sólo a principios de nuestro siglo se llegó a tener la adecuada evidencia experimental como para que quedara irrefutablemente demostrado que la materia estaba constituida por átomos y que, dentro de éstos, se podían distinguir electrones y una parte positiva, el núcleo (el cual es normalmente indivisible por métodos convencionales). En 1913, Neils Bohr propuso un modelo atómico que permitió, por primera vez, interpretar adecuadamente los espectros de emisión y absorción atómica. Para su modelo, Bohr utilizó magistralmente ideas de diversas áreas de la Física de su época (electromagnetismo, cuantificación de la energía, etc.), como ideas originales de él. A continuación se presenta el modelo de Bohr y después, esquemáticamente, el modelo atómico moderno.
2.2. Modelo Bohr Versión original del modelo de Bohr Para empezar, Bohr adhirió a la idea de que el electrón del hidrógeno giraba en círculos en torno al núcleo (sistema planetario), en órbitas estacionarias (que no decaen). Según teoría electromagnética clásica, los electrones acelerados (para mantener su orbita circular) deben emitir radiación electromagnética; ahora bien, al perder energía por este mecanismo, los electrones deberían terminar por ser atraídos al núcleo. Ante la evidencia experimental de la estabilidad de las órbitas, Bohr planteó el carácter estacionario de las órbitas electrónicas como un postulado. En tal movimiento, la fuerza centrífuga es compensada por la atracción del electrostática, por lo que se tiene: e 2 / r 2 = mv 2 / r donde e: valor absoluto de la carga del electrón. r: radio de la órbita m: masa del electrón v: velocidad el electrón En una órbita de radio r, la energía total del electrón (cinética + potencial) resulta ser: E t ( r ) = 1 / 2mv 2 − e 2 / r Para las órbitas estacionarias posibles del único electrón del hidrógeno, Bohr sugirió que la cantidad de movimiento mv por la longitud de la órbita, 2πr , estaba 2cuantificado”,
______________________________________________________________________ 39 P.D-S
en términos de un número entero de paquetes de movimiento de valor h, donde h es la constante de Plank. La correspondiente expresión analítica es: h mv = n , para n = 1,2,3,... 2πr A n se le denomina el número cuántico principal. Con las tres ecuaciones anteriores es posible calcular la energía del electrón y el radio correspondiente a las órbitas asociadas a los diferentes valores permitidos de n. Se demuestra fácilmente que: h2 r (n) = n 2 2 2 4π me o bien h2 r (n) = An 2 , con A = 2 2 4π me Además, − e 4 2n 2 m E t ( n) = n2h2 − e2 E t ( n) = r ( n) −B E t (n) = 2 n R[Aº]
Et(n)[eV] 0,529
2,116
4,761
n =2
n =3
n =1
Fig. 2.1. Se muestran los resultados de r(n) y de Et(n). Así, Bohr calculó el radio y las energías de las órbitas electrónicas permitidas. Sin embargo, ninguna de estas dos magnitudes pueden ser medidas directamente. Pero, como veremos, con su modelo él llegó a interpretar los espectros de emisión y absorción del hidrógeno, interpretación que entonces se consideró una demostración de la validez de sus ideas.
______________________________________________________________________ 40 P.D-S
2.3. Los espectros experimentales Bajo ciertas condiciones de excitación (por luz, calor, etc.) los átomos emiten luz, en general radiación electromagnética (visible o no) policromática. Al análisis de esta luz (en términos de frecuencia) se le llama espectro. Al calentar gas de hidrógeno, éste emite luz, la cual, con ayuda de un prisma, por ejemplo, puede ser descompuesta y analizada, ver figura 2.2. Se observa que la luz así emitida contiene ciertas frecuencias o rayas espectrales sobre un fondo continuo. Además, estas rayas espectrales se pueden agrupar en series; a cada serie se le puede asociar una ecuación empírica. Las primeras observaciones de este tipo se debieron a Balmer (1884)
Fig. 2.2 (a) Un espectro continuo conteniendo todas las longitudes de onda de la luz visible. (b) El espectro del hidrógeno conteniendo solo unas pocas longitudes de onda discretas. ______________________________________________________________________ 41 P.D-S
Sobre la base de resultados de numerosos físicos experimentales, se encontró las frecuencias obtenidas experimentalmente para el hidrógeno, obedecen a la siguiente relación empírica: 1 1 v s −1 = 3,276 ⋅ 1015 2 − 2 N n Cada una de las llamadas series resulta de fijar N y considerar varios valores de n. N y n son enteros, mayores que cero y con N>n.
[ ]
2.4. La interpretación de los espectros Para interpreta los espectros, Bohr recurrió a la ecuación de Planck-Einstein (1900), la que establece que la energía de E de una radiación está relacionada con su frecuencia v por la ecuación: E = hv donde h es la constante de Planck. Según postuló Bohr, mientras el electrón de hidrógeno esté en una órbita no emite radiación. Pero, cuando el electrón cambia de órbita, varia su energía, pues a cada órbita se asocia una energía determinada. Ahora bien, si un electrón pasa de una órbita de mayor energía E(N) a otra de menor energía E(n) , el electrón pierde energía. Según Bohr, esta energía se pierde en forma de radiación electromagnética emitida de frecuencia v , debiéndose satisfacer la relación E ( N ) − E ( n) = hv . Según lo ya expuesto, se tiene: −B −B E ( N ) = 2 y E (n) = 2 n N 1 B 1 Resulta que debe cumplirse v = − 2 − 2 con N > n. n h N Al comparar las ecuaciones de la frecuencia resultantes del modelo de Bohr y de los experimentos, se llegó a la conclusión de que había una buena concordancia entre ellas. Este fue el gran logro del modelo de Bohr. Lo que se ha presentado corresponde a los espectros de emisión, algo similar se puede hacer para los espectros de absorción. En una espectro de absorción hay que considerar que las radiaciones externas que pueden ser absorbidas por los electrones de las órbitas, están limitadas a aquellas que corresponden exactamente a las diferencias de energía entre una órbita inferior y una superior contigua.
______________________________________________________________________ 42 P.D-S
Fig. 2.3 Transiciones electrónicas en el modelo de Bohr para el átomo de hidrógeno. (a) Un diagrama de niveles de energía para las transiciones electrónicas. (b) Un diagrama de transición de orbitales. (c) Los espectros resultantes sobre un plano fotográfico.
______________________________________________________________________ 43 P.D-S
2.5.
Modificaciones al modelo de Bohr
El modelo de Bohr pudo explicar bastante bien el aspecto general del espectro de hidrógeno. Sin embargo, no lograba explicar el desdoblamiento de ciertas gruesas líneas espectrales en otras más finas, bajo efectos de campos eléctricos y/o magnéticos. Esto llevó a pensar que dentro de cada órbita o capa, descrita por el número cuántico principal n, había varias posibilidades de energía y no una sola. Así es como Sommerfeld propuso que las órbitas no eran necesariamente circulares, sino que, en general podían ser elípticas. Cada elipse puede ser caracterizada por un coeficiente de forma o excentricidad, que corresponde al cuociente entre el diámetro mayor y el diámetro menor de la elipse. Según Sommerfeld, los coeficientes de forma de las elipses posibles para una capa de número n dado, están limitados a ciertos valores dependientes del segundo número cuántico, l; éste último puede tomar valores enteros, según l = 0, 1, ... (n1). En particular, l =0 corresponde a un caso extremo de elipse, la circunferencia. El número l resulta de la cuantificación del momento magnético de la órbita electrónica. Ese momento magnético se relaciona con la geometría de la órbita que describe la carga eléctrica del electrón.
Mientras mayor es l, más excéntrica es la elipse. A “l” se le llama número cuántico azimutal. Ejemplo: Determinar e ilustrar esquemáticamente la variedad de órbitas elípticas posibles en el caso de una capa con n = 3. Para un n = 3, los valores posibles de l son 0, 1 y 2. Tres tipos de elipses, el primero de los cuales corresponde a una circunferencia.
2.6.
Nomenclatura
Para las capas caracterizadas por el número cuántico principal n, y para los sub-niveles o sub-capas caracterizadas por el número l, a menudo se usan letras, según la tabla que sigue.
Tabla 2.1. Nomenclatura para capas y tipos de orbitales
______________________________________________________________________ 44 P.D-S
Al moverse un electrón en una órbita, por el hecho de ser una carga eléctrica, se genera un dipolo magnético; bajo los efectos de un campo magnético externo estos dipolos se orientan. La energía potencial del dipolo magnético en un campo depende de la orientación del dipolo respecto de dicho campo. Este nuevo término de energía potencial influye en la posición de las líneas espectrales. Aprovechando la información contenida en los espectros se pudo deducir que una sub-capa de tipo l podía adoptar 2l + 1 orientaciones diferentes respecto de un campo externo. De este modo aparece el tercer número cuántico o número cuántico magnético m, que da cuenta de otro término de energía, asociado a las orientaciones de las sub-capas y que adopta valores enteros comprendidos entre –l y +l. Finalmente, se determinó la existencia de un cuarto número cuántico correspondiente al spin electrónico. Este cuarto número se interpretó “clásicamente” como asociado al movimiento de rotación del electrón sobre sí mismo. El número s adopta los valores de +1/2 y –1/2, valores con los cuales se calcula otro término de energía. A menudo estos dos valores posibles se ilustran por una flecha con una punta hacia arriba y por otra con la punta hacia abajo. Cada combinación diferente de n, l y m corresponde a un único estado cuántico llamado un orbital. El principio de exclusión de Pauli puede expresarse como que dos electrones en un mismo sistema no pueden tener exactamente la misma energía; de modo equivalente, no pueden tener los 4 números cuánticos iguales. Así, de acuerdo a este principio, cada orbital no puede contener más de dos electrones. Y a condición de que estos últimos tengan spines opustos. Ejemplo: ¿En una capa n = 3, podría haber hasta cuántos electrones? n=3 l =0 1 2 m = 0 -1,0,+1 -2,-1,0,+1,+2 Total: 9 orbitales, con capacidad de dos electrones cada uno, luego la respuesta es 18 electrones.
2.7.
Limitaciones del modelo
El modelo de Bohr con sus modificaciones (desarrollado entre 1913 y 1926) explicaba bastante bien la ubicación de las líneas del espectro del H ( Z = 1); pero ya en la interpretación del He ( Z = 2) tenía serias limitaciones. De esta manera que con todos sus ajustes, el modelo de Bohr, ahora incluyendo estos cuatro números cuánticos, describía muy bien la ubicación de las rayas (colores, frecuencias o longitudes de onda) del espectro de hidrógeno. Sin embargo, este modelo no predecía correctamente los espectros de cualquier otro átomo más complicado. Además, dicho modelo tampoco era capaz de explicar las intensidades de las rayas espectrales. (Tampoco era correcto en términos de la geometría de los orbitales). Una explicación más adecuada de la estructura electrónica se basa en ideas de la Física Moderna (mecánica ondulatoria, Principio de Incertidumbre de Heisemberg, etc.), que trataremos esquemáticamente a continuación. Al desarrollo de una teoría más satisfactoria contribuyeron numerosos científicos de esa época.
______________________________________________________________________ 45 P.D-S
2.8. Modelo Moderno Bases del modelo Hacia 1920, ya estaba claro que las radiaciones electromagnéticas (luz visible, rayos x, etc.) tenian, además de un evidente carácter ondulatorio, un carácter corpuscular. En particular, para la luz se ha definido los corpúsculos o paquetes de energía denominados fotones. La energía E de un fotón queda dada por la ecuación de Planck E = hv. Pues bien, en 1924, de Broglie propuso que los corpúsculos materiales también debían tener un carácter ondulatorio y que debían tener una longitud de onda asociada λ . A partir de las relaciones ya conocidas para la luz, de Broglie propuso que la cantidad de movimiento ( p = mv ) de un electrón cumplía con la relación λ = h / p . Incidentalmente, en 1927, Greninger y Germer demostraron experimentalmente que los electrones tenían también un carácter ondulatorio, revalidando irrefutablemente la idea previa concedida por de Broglie. De Broglie, también sugirió que los números enteros n asociados a las órbitas estacionarias debían tener que ver con los modos normales de vibración de las ondas estacionarias. Entonces, para una órbita circular estacionaria, el círculo 2πr debía ser igual a n veces la longitud de onda, de donde: 2πr = nλ h =λ mv h 2πr = n mv h p = mv = n (2πr ) Nótese que este último resultado corresponde a uno de los postulados de Bohr. Otra de las ideas básicas en la teoría atómica moderna es el principio de incertidumbre de Heisemberg que establece que no podemos medir ciertas parejas de magnitudes físicas (variables conjugadas) con una precisión infinita . Esta es una limitación de principio, no debida a errores experimentales. Así, si ∆p x es la precisión con que queremos medir la cantidad de movimiento de una partícula y ∆x es la precisión deseada para definir su posición, estas variables deben satisfacer la desigualdad: h ∆p x • ∆x ≥ con h = 6,63 ⋅ 10 −27 [erg ⋅ seg ] 2 Dado que el valor de h es pequeño, resulta que esta limitación prácticamente no afecta los objetos que observamos habitualmente, pero si afecta a los electrones y protones. Así, para estos últimos objetos debemos pensar en una distribución probabilística en cuanto a su posición y velocidad. Para referirse a la amplitud de la onda electrónica, Schrödinger utilizó la letra ψ , que denota la función de onda. Siendo las órbitas estados estacionarios de vibración, las ondas electrónicas debían satisfacer una ecuación diferencial matemáticamente análoga a la condición de una cuerda vibrante fija en sus extremos. La ecuación de Schrödinger (1929) para las ondas electrónicas estacionarias en una dimensión, es: d 2ψ 8πm + 2 (Et − V ) = 0 dx 2 h
______________________________________________________________________ 46 P.D-S
Et : energía electrónica total. E p : energía electrónica potencial Es útil recordar que para una cuerda vibrante, fija en sus extremos, la ecuación diferencial correspondiente es: d 2 u 4π 2 u = 0 + dx 2 λ2 donde u es el desplazamiento transversal de un segmento de cuerda dx; x es la distancia a lo lago de la cuerda y λ es la longitud de la onda Debemos destacar que estamos trabajando con leyes que son exactas, pero que son leyes de probabilidad. Las leyes de la “mecánica cuántica” son leyes que no determinan el estado (velocidad-posición) de las cosas. En tres dimensiones, la ecuación de Schrödinger se escribe: 8π 2 m (E t − V ) = 0 ∇ 2ψ + h2 A continuación sólo comentaremos los resultados de estos cálculos y la interpretación física correspondiente, sin introducir los detalles matemáticos de su deducción.
2.9. Resultados del Modelo Moderno Las soluciones de la ecuación de ondas para las distribuciones electrónicas en torno de un núcleo, son estrictas usualmente en la forma ψ = ψ ( r ,θ , ϕ ) . Estas soluciones son similares a las de la ecuación de la cuerda vibrante, en el sentido de que están cuantificadas y que contienen un número entero de nodos, pero la interpretación física de una solución para un electrón es fundamentalmente diferente de la de una cuerda.
Interpretación del cuadrado de la función de onda En primer lugar, la función de onda no puede ser interpretada simplemente como una amplitud, porque el principio de incertidumbre establece que no podemos conocer la posición de un electrón con suficiente precisión como para especificarlo de esta manera. Pero Bohr llegó a la interpretación siguiente en 1926: ψ 2 dV es la probabilidad de que el electrón sea encontrado en el volumen dV . Para una función esféricamente simétrica, centrada en el núcleo, ψ 2 dV es la probabilidad de que el electrón sea encontrado entre r y r + dr respecto del centro atómico. Esta interpretación parece razonable, considerando la siguiente analogía: conocemos que en el caso de la luz, la intensidad (y por lo tanto, la probabilidad de encontrar fotones), es proporcional al cuadrado de la amplitud de la onda luminosa.
Nodos y energía Otra característica de la función de onda que la distingue de la amplitud de una cuerda, es que se trata de una función tridimensional y, que generalmente, sus nodos (sitios donde ψ = 0 ), serán superficies en vez de puntos. Las posiciones de estos nodos en torno del núcleo indican dónde será nula la probabilidad de encontrar un electrón. Por otra parte, cuanto mayor sea el número de nodos en la función de onda de un electrón, mayor será su energía. Una aproximación razonable a la energía del electrón en un
______________________________________________________________________ 47 P.D-S
estado permitido, moviéndose en torno a una carga positiva unitaria, está dada nuevamente por la ecuación de Bohr: 2π 2 me 4 13,6 E = − 2 2 = − 2 [eV ] , n h n donde m la masa del electrón, e su carga y n es un entero mayor que cero llamado número cuántico principal.
Números cuánticos En contraste con las soluciones del problema de la cuerda vibrante unidimensional, que están caracterizados por un conjunto de números cuánticos (el número de nodos a lo largo de la cuerda), la solución de la ecuación de onda tridimensional debe tener tres conjuntos de números cuánticos, todos ellos enteros. Estos números cuánticos dela solución de la ecuación de Schrödinger tiene similar interpretación y rango que los números cuánticos del modelo de Bohr, ya presentados; por ello, se usa la misma nomenclatura n, l y m. El spin asociado al electrón mismo, también debe ser considerado en el modelo moderno.
Orbitales Cada combinación diferente de n, l y m corresponde a un único estado cuántico llamado orbital. De acuerdo con el principio de exclusión de Pauli, cada orbital no puede contener más que dos electrones y esos dos deben tener “spines” opuestos (designados usualmente por un cuarto número “s”, cuyos valores son únicamente +1/2 y –1/2.
Geometría de los orbitales En esta breve presentación cabe estacar una diferencia fundamental entre los modelos, la que se relaciona con la geometría de los orbitales. El conocimiento de la correcta geometría de los orbitales, particularmente la de los más externos, es fundamental para el posterior estudio de los enlaces y del comportamiento de los átomos cuando interactúan con otros átomos. Desde el punto de vista teórico, conocer la geometría de los orbitales, corresponde a conocer la distribución espacial de la función ψ 2 dV . En el modelo moderno, las geometrías corresponden a nubes tridimensionales de probabilidad asociadas, como en el modelo de Bohr, a los distintos valores de l. Ya mencionamos que, usualmente, en lugar de los valores numéricos de l, se emplean las letras s, p, d y f. Solamente los orbitales con l = 0, es decir, tipo s, presentan, aisladamente considerados, simetría esférica, ver figuras 2.4 y 2.5.
______________________________________________________________________ 48 P.D-S
Fig. 2.4 Dos representaciones para los orbitales 1s, 2s y 3s del átomo de hidrógeno. (a) probabilidad de la distribución del electrón. (b) superficie que contiene un 90% de la probabilidad de distribución del electrón. Por otra parte, aunque cada uno de los orbitales p dentro de una capa no es simétrico, ver figura 2.5, se puede demostrar que la suma de los tres orbitales completos p sí lo es. Así, si los tres orbitales p de una capa están completos (con seis electrones), tales orbitales forman un conjunto de simetría esférica. Similarmente ocurre con los cinco orbitales d y con los siete orbitales f.
Estructura electrónica de los elementos Con lo que hemos visto, ahora es posible describir la estructura de los átomos, no sólo de hidrógeno, al estado fundamental. En principio, con el modelo moderno es posible llegar a calcular en forma razonablemente correcta y para los diferentes elementos: Los números cuánticos y la energía de los orbitales. • La geometría de éstos. • Para el caso del hidrógeno, los valores de los niveles de energía son muy similares para ambos modelos. Como ya vimos, si hay diferencias en las geometrías de los orbitales. Consideremos la figura 2.5 donde se destacan algunos resultados cualitativos (correctos) del modelo Bohr, respecto de la energía de los orbitales. Se observa que, al aumentar n, la diferencia de energía entre dos capas sucesiva se hace menor y, además, aumenta la subdivisión de cada capa de orbitales. Por lo tanto, al aumentar n, se hace más probable la superposición de orbitales, en términos de energía, de capas con distinto n.
______________________________________________________________________ 49 P.D-S
Fig. 2.5 Representación de los orbitales 2p.
Et
d p s
n=3
p s
n=2
n=1
s
Fig. 2.6. Al aumentar n aumenta la tendencia a que se superpongan en energía los orbitales con valores de n. El esquema de cajas de la figura 2.7 ilustra la ubicación relativa en energía de los distintos orbitales. Cada “círculo” representa un orbital. Obsérvese que el orbital 4s presenta una energía muy próxima (y para muchos elementos, menor)que la del orbital 3d. Por otra parte, los valores precisos de las energías de los orbitales dependen de cada elemento. Cada elemento es un problema diferente, con distintas condiciones de borde, pues no sólo cambia el número de electrones, sino que también el núcleo. En efecto, para cada elemento caracterizado por su número Z y por sus partículas en el núcleo diferente de los protones, tenemos un conjunto específico de valores de energía. Pero, podemos usar, en ______________________________________________________________________ 50 P.D-S
forma cualitativa y sólo como primera aproximación, la distribución relativa de energías del hidrógeno, sin valores, como un gráfico maestro para orientarnos respecto del orden en energía en el cual se encuentran los orbitales de cualquier elemento, ver figura 2.7. En la práctica, cuando el Z se hace suficientemente grande, por la posible superposición de orbitales de mayor energía, hay que estudiar experimentalmente lo que ocurre para cada elemento y, de ser posible, hay que calcular con suficiente precisión las energías de los orbitales elemento a elemento. 6p 5d
6s
4f
5p 5s
4d 4p
E N E R G
Y
3d
4s 3p 3s
Fig. 2.7 Ubicación Cualitativa de los niveles electrónicos según energías relativas.
2p 2s 1s Para Determinar las fórmulas electrónicas de los elementos al estado fundamentales, a menudo es suficiente designar solamente los valores de n y l y el número de electrones en cada nivel l, ver tabla 2.2. En el estado fundamental, por definición, el conjunto de los electrones del átomo están en la condición de mínima energía. Por ejemplo, (1s)1 representa al hidrógeno con Z = 1, (1s)2 representa al helio con Z = 2, (1s)2(2s)2(2p)4 al oxígeno con Z = 8. Obsérvese que los valores permitidos de m y s, determinan cuántos electrones se requieren para llenar el estado l.
______________________________________________________________________ 51 P.D-S
La estructura electrónica del Na0 (Z = 11) al estado fundamental, esta ilustrada en la figura 2.8.
Fig. 2.8 Configuración del Na con modelo de cajas y de letras. Cabe señalar que para definir detalladamente la fórmula electrónica de algunos elementos, hay que considerar también el principio de Hund. Este establece que en la medida de lo posible, los electrones en un mismo tipo de orbital caracterizado por l, tenderán a presentar spines paralelos. (También en un conjunto de orbitales hibridizados) En la tabla 2.2 nótese también la particular estructura electrónica exterior de los elementos desde Z = 19 hasta Z = 28. A los elementos desde Z = 21 hasta Z = 28 se les llama ELEMENTOS DE LA PRIMERA SERIE DE METALES DE TRANSICIÓN. Hay otras series de transición superiores. En esta serie se encuentran muchos metales de interés industrial.
Análisis químico por espectrometría Incidentalmente, de lo expuesto en este capítulo se deduce que cada elemento tiene sus propias rayas espectrales, asociadas a las transiciones electrónicas, las que lo caracterizan como una huella digital. Ello se puede emplear para análisis químico por espectrometría: los colores identifican a los elementos (análisis cualitativo) y la intensidad de los colores, con una calibración adecuada, permiten saber cuánto hay de dicho elemento (análisis cuantitativo). El modelo moderno permite abordar, en principio (pero con dificultad) el cálculo de las intensidades de las rayas espectrales.
______________________________________________________________________ 52 P.D-S
TABLA 2.2. CONFIGURACIONES ELECTRÓNICAS DE LOS ELEMENTOS
______________________________________________________________________ 53 P.D-S
Referencias Bibliográficas Fisicoquímica / Ira N. Levine ; traducción Angel González Ureña. Madrid : McGraw-Hill, 1996. Fundamentos de la ciencia e ingeniería de materiales / William F. Smith ; traducción Alicia Larena Pellejero. Madrid : McGraw-Hill, 1998.
______________________________________________________________________ 54 P.D-S
3. Estructura y Geometría Cristalinas 3.1. Redes espaciales y celdas unitarias La importancia en la ingeniería de la estructura física de los materiales sólidos depende principalmente de la disposición de los átomos, iones o moléculas que constituyen el sólido y de las fuerzas de enlace entre ellos. Si los átomos o iones de un sólido se ordenan de una disposición que se repite en tres dimensiones, forman un sólido del que se dice tiene una estructura cristalina y nos referimos a él como un sólido cristalino o material cristalino. Ejemplos de materiales cristalinos son metales, aleaciones y algunos materiales cerámicos.
Fig. 3.1 (a) Retículo espacial de un sólido cristalino ideal. (b) Celdilla unidad con indicación de las constantes reticulares. El ordenamiento atómico en los sólidos cristalinos puede representarse asimilando los átomos a los puntos de intersección de una red de líneas en tres dimensiones. Tal red se llama retículo espacial (fig. 3.1a) y puede ser descrita como una disposición de puntos tridimensional infinita. Cada punto en la red espacial tiene idéntico entorno. En un cristal ideal, la agrupación de puntos reticulares alrededor de cualquier punto dado es idéntica con la agrupación en torno a cualquier otro punto reticular en la red cristalina. Cada red espacial puede ser descrita de este modo, especificando las posiciones atómicas en una celda unidad que se repite, tal como la que se ha perfilado en la figura 3.1a. El tamaño y la forma de la celda unidad puede describirse por tres vectores reticulares a, b y c, que se originan a partir de un vértice de la celda unidad (fig.3.1b). Las longitudes axiales a, b, y c y los ángulos inter-axiales α, β y γ son las constantes reticulares.
3.2. Sistemas Cristalinos y Redes de Bravais Asignando valores específicos para las longitudes axiales y los ángulos inter-axiales, se pueden construir deferentes tipos de celda unidad. Los cristalógrafos han mostrado que son necesarias sólo siete tipos diferentes de celda unidad para crear todas las redes puntuales. Estos sistemas se recogen en la tabla 3.1. La mayor parte de estos siete sistemas cristalinos presentan variaciones de la celda unidad básica. A. J. Bravais mostró que las 14 celdas unidad estándar podían describir todas las estructuras reticulares posibles. Estas redes de Bravais se ilustran en la figura 3.2. Hay cuatro tipos básicos de celda unidad: (1) Sencilla, (2) Centrada en el cuerpo, (3) Centrada en las caras, y (4) Centrada en la base.
______________________________________________________________________ 55 P.D-S
En el sistema cúbico hay tres tipos de celda unidad: cúbica sencilla, cúbica centrada en el cuerpo y cúbica centrada en las caras. En el sistema ortorrómbico están representados los cuatro tipos. En el sistema tetragonal hay sólo dos: sencilla y centrada en el cuerpo. La celda unidad tetragonal centrada en las caras parece que falta, pero se puede formar a partir de cuatro celdas unidad tetragonales centradas en el cuerpo. El sistema monoclínico tiene celdas unidad sencilla y centrada en la base, y los sistemas romboédrico, hexagonal y triclínico tiene sólo una celda unidad.
3.3. Principales estructuras cristalinas metálicas En este capítulo se discutirán con detalle las principales estructuras de metales elementales. La mayoría de los metales elementales (cerca del 90%) cristalizan en tres estructuras cristalinas densamente empaquetadas: cúbica centrada en el cuerpo (BCC) (fig. 3.3a), cúbica centrada en las caras (FCC) (fig. 3.3b) y hexagonal compacta (HCP) (fig. 3.3c). La estructura HCP es una modificación más densa de la estructura cristalina hexagonal sencilla (fig. 3.2). La mayor parte de los metales cristaliza en estas estructuras densamente empaquetadas debido a que se libera energía a medida que los átomos se aproximan y e enlazan cada vez más estrechamente entre sí. De este modo, dichas estructuras densamente empaquetadas se encuentran en disposiciones u ordenamientos de energía cada vez más baja y estable. El pequeño tamaño de las celdillas unidad de los metales cristalinos que se muestran en la figura 3.3 debería ser el resultado: La arista del cubo de la celda unidad del hierro cúbico centrado en el cuerpo, por ejemplo, a temperatura ambiente es igual a 0,287*10-9m, ó 0,287 namómetros (nm). Por consiguiente, si las celdas unidad de hierro puro estuvieran alineadas arista con arista en 1mm, habría:
1 mm ×
1 celda unidad = 3,48 ⋅ 10 6 celdas unidad −6 0,287 nm × 10 mm / nm
Examinemos ahora detalladamente la disposición de los átomos en las celdas unidad de las tres principales estructuras cristalinas. Aunque sea sólo sea una aproximación, consideremos a los átomos de estas estructuras como esferas rígidas. Las distancia entre los átomos (distancia interatómica) en las estructuras cristalinas puede ser determinado experimentalmente por análisis de difracción de rayos X. Por ejemplo, la distancia interatómica entre dos átomos de aluminio en un fragmento de aluminio puro a 20ºC es 0,2862 nm. Se considera que el radio del aluminio en el aluminio metal es la mitad de la distancia interatómica, ó 0,143 nm. Los radios atómicos de determinados átomos metálicos son recogidos en las tablas 3.2 y 3.4. En primer lugar consideremos la situación de los átomos en la celda unidad para la estructura cristalina BCC mostrada en la figura 3.4a. En esta celda unidad las esferas sólidas representan los centros donde los átomos están localizados e indican claramente sus posiciones relativas. Si representamos los átomos en estas celdas como esferas rígidas, entonces la celda unidad presentará el aspecto en la figura 3.4b. En esta celda unidad podemos observar que el átomo central se encuentra rodeado por otros ocho vecinos más cercanos y se dice tiene un número de coordinación de 8. Si asilamos una celda unidad sencilla de esferas rígidas, obtendremos el modelo mostrado en la figura 3.4c. Cada una de estas celdas tiene el equivalente de dos átomos por celda unidad. Un átomo completo está localizado en el centro de la celda unidad, y un ______________________________________________________________________ 56 P.D-S
octavo de esfera está localizado en cada vértice de la celda unidad, haciendo el equivalente de otro átomo. De este modo, hay un total de 1 (en el centro) + 8*1/8 (en los vértices) = 2 átomos por celda unidad. TABLA 3.1 CLASIFICACIÓN DE RETÍCULOS ESPACIALES EN SISTEMAS CRISTALINOS Sistema Longitudes axiales y Retículos espaciales Cristalino Ángulos interaxiales Cúbico Ejes iguales en ángulos rectos. Cúbico sencillo. Cúbico Centrado en el a = b = c, α = β = γ = 90º cuerpo. Cúbico centrado en las caras. Tetragonal sencillo. Tetragonal Ejes en ángulos rectos. a = b ≠ c, α = β = γ = 90º Tetragonal centrado en el cuerpo. Ortorrómbico Ejes distintos en ángulos rectos. Ortorrómbico sencillo a ≠ b ≠ c, α = β = γ = 90º Ortorrómbico centrado en el cuerpo. Ortorrómbico centrado en las bases. Ortorrómbico centrado en las caras. Romboédrico Ejes iguales inclinados por igual. Romboédrico sencillo. a = b = c, α = β = γ ≠ 90º Hexagonal Ejes iguales a 120º y a 90º con el Hexagonal sencillo. tercero. a = b ≠ c, α = β = 90º , γ = 120º Monoclínico Ejes distintos, dos de ellos no Monoclínico sencillo. Monoclínico centrado en forman ángulo recto. a ≠ b ≠ c, α = γ = 90º ≠ β las bases. Triclínico Ejes distintos con distinta Triclínico sencillo. inclinación y ninguno en ángulo recto. a ≠ b ≠ c, α ≠ β ≠ γ ≠ 90º Los átomos en las celdas BCC contactan entre sí a través de la diagonal del cubo, según indican en la figura 3.5, de modo que la relación entre la longitud de la cara del cubo a y el radio atómico R es:
3a = 4 R o bien a =
4R 3
Si los átomos en la celda BCC se consideran esféricos, el factor de empaquetamiento atómico (APF) puede calcularse usando la ecuación:
______________________________________________________________________ 57 P.D-S
APF =
volumen de átomos en la celda BCC volumen de la celda unidad BCC
A continuación consideremos la celda reticular unitaria FCC de la figura 3.6a. En esta celda unidad hay un punto reticular en cada vértice del cubo y otro en el centro de cada cara del cubo. El modelo de esferas sólidas del la figura 3.6b indica que los átomos de esta estructura están unidos del modo más compacto. El APF de esta estructura de empaquetamiento compacto es 0,74 que al compararla con el valor de 0,68 para la estructura BCC, indica que ésta no es compacta. La celda FCC, según muestra la figura 3.6c, tiene el equivalente a cuatro átomos por celda unidad. Los ocho octavos de átomo de los vértices cuentan por uno entero (8*1/8 = 1) y los seis medios átomos en las caras del cubo contribuyen con otros tres átomos más, haciendo un total de cuatro átomos por celda unidad. Los átomos en la celda FCC contactan entre sí a lo largo de la diagonal de la cara del cubo, según se observa en la figura 3.7, de tal modo que la relación entre la longitud de la cara del cubo y el radio atómico es:
2a = 4 R o bien a =
4R 2
El APF para la estructura FCC es 0,74 que es mayor que el factor 0,68 de la estructura BCC. El APF de 0,74 es el máximo posible para empaquetamiento de átomos esféricos. Muchos metales como Cu, Al, Pb, Ni y Fe a elevadas temperaturas (912 a 1394°C) cristalizan según la estructura FCC. La tabla 3.3 muestra las constantes reticulares y los radios atómicos para los metales seleccionados con estructura FCC. La tercera estructura electrónica más común es la HCP, mostrada en la figura 3.8. Los metales no cristalizan en la estructura hexagonal sencilla de la figura 3.2 porque el APF es demasiado bajo. Los átomos pueden alcanzar una energía más baja y unas condiciones más estables para formar la estructura HCP de la figura 3.8. El APF de esta estructura es 0,74 el mismo que para la estructura FCC, ya que para ambas estructuras los átomos están empaquetados de un modo lo más cercano posible. En ambas estructuras, HCP y FCC, cada átomo está rodeado de otros 12 átomos y por tanto ambas estructuras tienen un número de coordinación 12. Las diferencias en el empaquetamiento atómico en las estructuras cristalinas HCP y FCC serán estudiadas más adelante. La celda unidad HCP aislada aparece representada en la figura 3.8c y tiene un equivalente de seis átomos por celda unidad. Tres átomos forman un triángulo en la capa intermedia, como se indica por las posiciones atómicas en la figura 3.8a. Existen 6*1/6 secciones de átomos en las capas de arriba y de abajo, haciendo un equivalente de 2 átomos más (2*6*1/6 = 2). Finalmente, hay dos mitades de átomos en el centro de ambas capas superior e inferior, haciendo el equivalente de un átomo más. El número total de átomos en la estructura HCP es, por tanto, 3 + 2 + 1 = 6. La relación de la altura c del prisma hexagonal de la estructura cristalina HCP al lado de la base a, se llama relación c/a (fig. 3.8a). La relación c/a para una estructura cristalina HCP ideal consistente en esferas uniformes tan próximas como sea posible es
______________________________________________________________________ 58 P.D-S
Fig. 3.2 Las 14 celdillas unidad convencionales de la red de Bravais agrupadas por sistemas cristalinos. Las esferas indican puntos reticulares que cuando están situados en las caras o en los vértices están compartidos con otras celdillas unidad reticulares idénticas. 1,633. La tabla 3.4 muestra algunos metales HCP importantes y sus relaciones c/a. De los metales listados, cinc y cadmio tienen una relación c/a más lata de lo ideal, lo que indica que los átomos en estas estructuras están ligeramente elongadas a lo largo del eje c en la celda unidad HCP. Los metales de magnesio, circonio, titanio y berilio tienen relaciones c/a menores que la relación ideal. Por tanto, en estos metales los átomos están ligeramente comprimidos a lo largo de la dirección del eje c. De este modo, para los metales HCP listados en la tabla 3.4 se da una cierta cantidad de desviación del modelo ideal de esferas rígidas.
______________________________________________________________________ 59 P.D-S
Fig. 3.3 Celdillas unidad de las principales estructuras cristalinas metálicas. (a) Cúbica centrada en el cuerpo; (b) Cúbica centrada en lasa caras; (c) Hexagonal compacta.
Fig. 3.4 Celdillas unidad BCC; (a) de posiciones atómicas; (b) de esferas rígidas; (c) celdilla unidad aislada. TABLA 3.2 ALGUNOS METALES CON ESTRUCTURAS CRISTALINAS BCC A TEMPERATURA AMBIENTE (20ºC), SUS CONSTANTES RETICULARES Y SUS RADIOS ATÓMICOS. Metal Constante Reticular (a), nm Radio atómico R*, nm Cromo 0.289 0.125 Hierro 0.287 0.124 Molibdeno 0.315 0.136 Potasio 0.533 0.231 Sodio 0.429 0.185 Tántalo 0.330 0.143 Wolframio 0.316 0.137 Vanadio 0.304 0.132
______________________________________________________________________ 60 P.D-S
Fig. 3.5 Celdilla unidad BCC que muestra la relación entre la constante de red y el radio atómico.
Fig. 3.6 Celdillas unidad FCC: (a) de posiciones atómicas; (b) de esferas rígidas; (c) celdilla unidad aislada. TABLA 3.3 ALGUNOS METALES CON ESTRUCTURAS FCC A TEMPERATURA AMBIENTE (20ºC), SUS CONSTANTES DE RED Y SUS RADIOS ATÓMICOS. Metal Constante de red (a), nm Radio atómico R*, nm Aluminio 0.405 0.143 Cobre 0.3615 0.128 Hierro 0.408 0.144 Plomo 0.495 0.175 Níquel 0.352 0.125 Platino 0.393 0.139 Plata 0.409 0.144
______________________________________________________________________ 61 P.D-S
Fig. 3.7 Celdilla unidad FCC que muestra la relación entre la constante de red y el radio atómico R. Los átomos contactan a lo largo de las diagonales de las caras 2a = 4 R . TABLA 3.4 ALGUNOS METALES CON ESTRUCTURA HCP A TEMPERATURA AMBIENTE (20ºC), SUS CONSTANTES DE RED, SUS RADIOS ATÓMICOS REALACIONALES c/a. % de variación Metal Constantes de Radio atómico Relación de la relación red, nm R, nm ideal a c c/a Cadmio 0.2973 0.5618 0.149 1.89 +15.7 Cinc 0.2665 0.4947 0.133 1.856 +13.6 HCP ideal 1.633 0 Magnesio 0.3209 0.5209 0.160 1.623 -0.66 Cobalto 0.2507 0.4069 0.125 1.623 -0.66 Circonio 0.3231 0.5148 0.160 1.593 -2.45 Titanio 0.2950 0.4683 0.147 1.587 -2.81 Berilio 0.2286 0.3584 0.113 1.586 -3.98
3.4. Posiciones atómicas en las celdas unidad cúbica Para localizar las posiciones atómicas en las celdas unidad utilizamos el sistema de ejes x, y, y z. En cristalografía, el eje x positivo es normalmente la dirección perpendicular al plano del papel, el eje y positivo es la dirección hacia la derecha del papel y el eje z positivo es la dirección hacia la parte superior. Las direcciones negativas son las opuestas a las que se acaban de describir. Las posiciones atómicas en celdas unitarias se localizan usando distancias unidad a lo largo de los ejes x, y, y z como se indica en la figura 3.9a. Por ejemplo las coordenadas de posición para los átomos en la celda unidad BCC se muestran en la figura 3.9b. Las posiciones atómicas para los ocho átomos situados en los vértices de la celda unidad BCC son (0,0,0) (1,0,0) (0,1,0) (0,0,1) (1,1,1) (1,1,0) (1,0,1) (0,1,1)
______________________________________________________________________ 62 P.D-S
Fig. 3.8 Celdillas unidad HCP: (a) de posiciones atómicas; (b) de esferas rígidas; (c) celdilla unidad aislada. El átomo central de la unidad celular BCC tiene las coordenadas (1/2,1/2,1/2). Las posiciones atómicas de la celda unidad que son (0,0,0) y (1/2,1/2,1/2). Las posiciones atómicas restantes de la celda unidad se suponen comprendidas. De la misma manera, las posiciones atómicas en la celda unidad FCC pueden ser localizadas.
3.5. Direcciones en celdas unidad cúbicas A menudo, es necesario referirnos a posiciones específicas en las redes cristalinas. Esto es especialmente importante para metales y aleaciones con propiedades que varían con la orientación cristalográfica. Para cristales cúbicos los índices de las direcciones cristalográficas son los componentes vectoriales de las direcciones resueltos a lo largo de cada eje coordenado y reducidas a los enteros más pequeños.
______________________________________________________________________ 63 P.D-S
Para indicar en un diagrama una dirección en una celda cúbica unitaria, dibujamos un vector de dirección desde el origen (que es normalmente una esquina de la celda cúbica) hasta que sale a la superficie del cubo (fig. 3.10). Las coordenadas de posición de la celda unidad donde el vector de dirección sale de la superficie del cubo después de ser convertidas a enteros son los índices de dirección. Los índices de dirección se encierran entre corchetes [ ] sin separación por comas.
Fig. 3.9 (a) Ejes rectangulares x, y, z, para la localización de las posiciones atómicas en celdillas unidad cúbicas. (b) Posiciones atómicas en una celdilla unidad BCC. Por ejemplo, las coordenadas de posición del vector de dirección OR en la figura 3.10a donde sale de la superficie cúbica es (1,0,0) y de este modo los índices de dirección para el vector OR son [110]. Las coordenadas de posición del vector OS (fig. 3.10a) son (1,1,0) y así los índices de dirección para OS son [110]. Las coordenadas de posición para el vector OT (fig. 3.10b) son (1,1,1) y así los índices de dirección de OT son [111].
Fig. 3.10 Alguna direcciones en celdillas unidad cúbicas Las coordenadas de posición del vector director OM (fig. 3.10c) son (1,1/2,0), y como los vectores dirección han de ser enteros, estas posiciones han de ser multiplicadas por dos para obtener enteros. Así, los índices de posición de OM quedan convertidos en: 2(1,1/2,0) = [210]. Un índice negativo de dirección se escribe con una barra sobre el índice. Así los índices de dirección para el vector ON son [110] . Obsérvese que para dibujar la dirección ON dentro del cubo, el origen del vector director tiene que llevar al vértice inferior derecho del cubo unidad (fig. 3.10d). ______________________________________________________________________ 64 P.D-S
Las letras u,v,w son utilizadas generalmente para índices de dirección en las direcciones de los ejes x,y, z respectivamente y se escriben con [u v w]. Es importante destacar que todos aquellos vectores de dirección paralela tiene los mismos índices de dirección. Las direcciones se dice que son cristalográficamente equivalentes si los espacios atómicos a lo largo de cada dirección son los mismos. Por ejemplo, las siguientes direcciones de una arista del cubo son cristalográficamente equivalentes:
[100], [010], [001], [010], [001], [100] ≡
100
3.6. Indices de Miller para planos cristalográficos en celdas de unidad cúbica A veces es necesario referirnos a los planos reticulares específicos de átomos dentro de una estructura cristalina o puede ser interesante conocer la orientación crsitalográfica de un plano o grupo de planos en una red cristalina. Para identificar los planos cristalinos en estructuras cristalinas cúbicas se usa la notación de Miller: Los índices de Miller de un plano cristalino están definidos como los recíprocos de las intersecciones que el plano determina con los ejes x, y, z de los tres lados no paralelos del cubo unitario. Las aristas de una celda cúbica unitaria representan longitudes unitarias y las intersecciones de los planos de una red se miden sobre la base de estas longitudes unitarias. El procedimiento de determinación de los índices de Miller para un plano de un cristal cúbico es el siguiente: 1. Escoger un plano que no pase por el origen (0,0,0). 2. Determinar las intersecciones del plano en base a los ejes x, y, z cristalográficos para un cubo unitario. Estas intersecciones pueden fraccionarias. 3. Construir los recíprocos de estas intersecciones. 4. Despejar las fracciones y determinar el conjunto más pequeño de números enteros que estén en la misma razón que las intersecciones. Estos números enteros son los índices de Miller de un plano cristalográfico y se encierran entre paréntesis sin usar comas. La notación (hkl) se usa para indicar los índices de Miller en sentido general, donde h, k y l son los índices de Miller para un plano de un cristal cúbico de ejes x, y y z respectivamente. La figura 3.11 muestra tres de los más importantes planos cristalográficos de las estructuras cúbicas. Consideremos primero el plano cristalino sombreado de la figura 3.11a, con intersecciones 1, ∞, ∞ a los ejes x, y y z respectivamente. Tomamos los recíprocos de estas intersecciones para obtener los índices de Miller que son, por consiguiente, 1, 0, 0. Como estos números no son fraccionarios, los índices de Miller para este plano son (100) que es leído como el plano uno, cero, cero. Seguidamente, consideremos el segundo plano mostrado en la figura 3.11b. Las intersecciones de este plano son 1,1, ∞ . Puesto que los recíprocos de estos números son 1, 1, 0 no involucran fracciones, siendo los índices de Miller para este plano (110). Finalmente, el tercer plano, figura 3.13c tiene las intersecciones 1, 1, 1 que nos dan un índice de Miller (111) para este plano. ______________________________________________________________________ 65 P.D-S
Considérese ahora el plano del cristal cúbico mostrado en la figura 3.12 con intersecciones 1/3, 273, 1. Los recíprocos son 3, 3/2,1. Puesto que no están aplicadas por
Fig. 3.11 Índices de Milles de algunos planos cristalinos importantes. dos para convertir la fracción 3/2 en un entero. Así la intersección recíproca se convierte en 6, 3 y 2 y los índices de Miller son (632). Si se considera que el plano cristalino pasa por el origen de manera que una o más intersecciones son cero, el plano ha de ser desplazado hasta una posición equivalente en la misma celdilla unidad de modo que el plano permanezca paralelo al plano origen. Esto es posible porque todos los planos paralelos equidistantes se denotan mediante los mismos índices de Miller. Si grupos de planos reticulares equivalente sestán relacionados por la simetría del sistema cristalino, se llaman planos de una familia o forma. Los índices de un plano de la familia son encerrados entre llave, como {hkl} para representar los índices de una familia de planos simétricos. Por ejemplo, los índices de Miller de los planos de la superficie del cubo (100), (010) y (001) se designan colectivamente como una familia o forma por la notación {100}.
Fig. 3.12 Plano cristalino cúbico (632) con intersecciones fraccionarias. Una importante relación para el sistema cúbico y sólo para el sistema cúbico es que los índices de una dirección perpendicular a un plano del cristal son los mismos que los
______________________________________________________________________ 66 P.D-S
índices de Miller para ese plano. Por ejemplo, la dirección [100] es perpendicular al plano cristalino (100). En estructuras cristalinas cúbicas la distancia interplanar entre dos planos paralelos muy cercanos con los mismos índices de Miller se designa como d hkl , donde h, k y l son los índices de Miller de los planos. Este espaciado representa la distancia desde un origen elegido contenido en un plano y otro plano paralelo con los mismos índices que sea muy cercano a él. Por ejemplo, la distancia entre los planos (110) 1 y 2, d110 , en la figura 3.13 es AB. También la distancia entre los planos (110) 2 y 3 es d110 y su longitud es BC en la figura 3.13. A partir de conocimientos geométricos sencillos puede ser mostrado para estructuras cristalinas que
d hkl =
a h2 + k 2 + l 2
donde
d hkl : distancia interplanar entre los planos más cercanos paralelos con índices de Miller h, k y l.
a : Constante de red (lados del cubo de unidad) h, k , l : Índices de Miller de los planos cúbicos objeto de consideración.
Fig. 3.13 Vista superior de una celdilla unidad que muestra la distancia entre planos cristalinos [110], d100.
______________________________________________________________________ 67 P.D-S
3.7. Comparación entre las estructuras cristalinas FCC, HCP y BCC Como anteriormente se ha indicado, ambas estructuras cristalinas HCP y FCC son estructuras compactas. Esto es, sus átomos, que son considerados aproximadamente esferas y se encuentran tan íntimamente agrupados como es posible, permiten que se consiga un factor de empaquetamiento de 0,74. Los planos (1 1 1) de la estructura cristalina FCC mostrados en la figura 3.14b. Sin embargo, tridimensionalmente, las estructuras cristalinas FCC y HCP no son idénticas debido a que existe una diferencia en la disposición de apilamiento de sus planos atómicos, los cuales pueden describirse mejor por consideración del apilamiento de esferas rígidas que representa a los átomos. Como analogía útil, uno puede imaginar el empaquetamiento de planos basándose en canicas de igual tamaño una sobre otra, minimizando el espacio entre las canicas.
Fig. 3.14 Comparación de (a) la estructura cristalina FCC mostrando planos (111) de empaquetamiento compacto y (b) de la estructura HCP mostrando planos de empaquetamiento compacto (0001).
______________________________________________________________________ 68 P.D-S
Fig. 3.15 Formación de estructuras cristalinas HCP y FCC por apilamiento de planos de empaquetamiento compacto de átomos. Considérese un plano de átomos compactos designado como plano, tal como se muestra en la figura 3.15a. Obsérvese que hay dos tipos diferentes de espacios vacíos o huecos entre los átomos. Los espacios señalados en la parte superior de la figura son designados espacios a, y los señalados en la parte inferior de la figura, espacios b. Un segundo plano de átomos puede ser localizado sobre los huecos a y b y se producirá la misma estructura tridimensional. Localicemos el plano B sobre los espacios a, como se muestra en la figura 3.15b. Ahora si un tercer plano de átomos se coloca sobre el plano B para formar una estructura compacta, es posible formar dos estructuras de empaquetamiento compacto diferentes. Una posibilidad es situar los átomos del tercer plano sobre los huecos b del plano B. Entonces los átomos del tercer plano descansarán directamente sobre el plano A y así pueden designarse como un nuevo plano A (fig. 3.15c). Si subsiguientes planos de átomos se colocan en este orden de apilamiento, entonces la secuencia de apilamiento de la estructura tridimensional producida puede ser denominada ABABAB... Tal secuencia de apilamiento lleva a la estructura cristalina HCP (fig. 3.14b). La segunda posibilidad para formar una estructura compacta es situar el plano tercero en los huecos a del plano B (fig. 3.15d). Este tercer plano se designa como plano C, puesto que sus átomos no descansan sobre los del plano B, ni sobre los átomos del plano A. La secuencia de apilamiento en esta estructura compacta se designa así como ABCABCAB... y lleva una estructura FCC. Mostrad en la figura 3.14a. La estructura BCC no es una estructura compacta, de ahí, que no tenga planos compactos entre como los planos {111} de la estructura FCC y los planos {0001} de la estructura HCP. Los planos más densos en la estructura BCC son los planos de la familia {110} de los cuales el plano (110) se muestra en la figura 3.16.b, Los átomos, sin embargo, en la estructura BCC tienen unas direcciones compactas a lo largo de las diagonales del cubo, que son las direcciones 111 .
3.8. Polimorfismo y alotropía Muchos compuestos y elementos existen en más de una forma cristalina bajo diferentes condiciones de temperatura y presión. Este fenómeno es determinado como polimorfismo o alotropía. Muchos metales industrialmente importantes como el hierro, ______________________________________________________________________ 69 P.D-S
titanio y cobalto experimentan transformaciones alotrópicas a elevadas temperaturas manteniendo la presión atmosférica. La tabla 3.5 recoge algunos metales seleccionados que muestran transformaciones alotrópicas y cambios de estructura. El hierro existe en ambas estructuras cristalinas BCC y FCC, sobre un rango de temperaturas que va desde la temperatura ambiente hasta su punto de fusión a 1539°C, como se muestra en la figura 3.24. El hierro (α) existe desde – 273 a 912°C y tiene la estructura cristalina BCC. El hierro (γ) existe desde 912 hasta 1394°C y tiene su estructura cristalina FCC. El hierro delta (δ) existe desde 1394 hasta 1539°C, que es el punto de fusión del hierro. La estructura cristalina del hierro delta es también la BCC pero con una constante de red mayor que la del hierroα.
3.9. Análisis de la estructura del cristal Nuestro criterio actual de las estructuras cristalinas ha sido obtenido principalmente por medio de técnicas de difracción de rayos X, que utilizan rayos X de la misma longitud TABLA 3.5 FORMAS CRISTALINAS ALOTRÓPICAS DE ALGUNOS METALES Metal Estructura cristalina a temperatura A otras temperaturas ambiente Ca FCC BCC (> 447ºC) Co HCP FCC (> 427ºC) Hf HCP BCC (> 1742ºC) Fe BCC FCC (912 –1394ºC) BCC (> 1394ºC) Li BCC HCP (< -193ºC) Na BCC HCP (< -223ºC) Tl HCP BCC (>234ºC) Ti HCP BCC (> 883ºC) Y HCP BCC (>1481ºC) Zr HCP BCC (> 872ºC)
Fig. 3.16 Estructura cristalina BCC mostrando: (a) el plano (100); (b) una sección del ______________________________________________________________________ 70 P.D-S
plano (110). Obsérvense que aunque no es una estructura de empaquetamiento compacta, las diagonales las diagonales si son direcciones de empaquetamiento compacto. de onda que la distancia entre los planos de la red cristalina. Sin embargo, antes de discutir la manera en la cual los rayos X son producidos para propósitos experimentales. Los rayos X utilizados para la difracción de ondas electromagnéticas con longitudes de onda oscilan entre 0,05 y 0,25 nm (0,5 y 2,5 A ). Para producir rayos X para propósitos de difracción es necesario un voltaje de unos 35kV y se suministra entre un cátodo y un metal diana anódico, ambos mantenidos en vacío como se muestra en la figura 3.17. Cuando el filamento de wolframio del cátodo se calienta, se liberan electrones por emisión termoiónica y se aceleran a través del vacío por la gran diferencia de voltaje entre el cátodo y el ánodo, por consiguiente ganando energía cinética. Cuando los electrones golpean la lámina de metal (por ej.: molibdeno) se emiten rayos X. Sin embargo, la mayor parte de la energía cinética (cerca del 98%) se convierte en calor, por tanto, la muestra tiene que enfriarse externamente.
Fig. 3.17 Diagrama esquemático de la sección transversal de un tubo de rayos X de filamento sellado. El espectro emitido a 35kV usando una lámina de molibdeno se muestra en la figura 3.18. El espectro muestra radiación continua de rayos X para una longitud de onda que oscila entre 0,2 y 1,4 A (0,02 y 0,14 nm) y dos picos de radiación determinada se designan las líneas K α y K β . Las longitudes de onda de las líneas K α y K β son características de un determinado elemento. En el molibdeno la línea K α aparece a una longitud de onda de unos 0,7 A. El origen de esta radiación determinada se explica como sigue. Primero, electrones K (electrones del orbital n = 1) se expulsan del átomo por bombardeo de la lámina con electrones altamente energéticos dejando los átomos excitados. A continuación, algunos de los electrones de orbitales más altos (es decir n = 2 o n = 3) caen a niveles energéticos más bajos, para reemplazar los electrones K perdidos, emitiendo energía de una determinada longitud de onda. La transición de electrones del orbital L (n =
______________________________________________________________________ 71 P.D-S
2) al orbital K (n = 1) genera energía de longitud de onda correspondiente a la línea K α como indica la figura 3.19.
Fig. 3.18 Espectro de emisión de rayos X cuando se utiliza molibdeno metálico como blanco en un tubo de rayos X operado a 35 kV. Puesto que las longitudes de onda de algunos rayos X son más o menos iguales a la distancia entre planos de átomos en sólidos cristalinos, los picos de difracción debidos a la radiación de intensidades variables se pueden producir cuando un grupo de rayos X golpea un sólido cristalino. Sin embargo, antes de considerar la aplicación de las técnicas de difracción de rayos X al estudio de las estructuras del cristal, estudiemos las condiciones geométricas necesarias para producir difracción o reforzar los grupos de rayos X reflejados. Consideremos que un haz de rayos X monocromático (longitud de onda sencilla) incide sobre un cristal, como se muestra en la figura 3.20. Por simplificación, permitamos el reemplazamiento de planos cristalinos de centros de dispersión atómicos por planos cristalinos que actúan como espejos reflejando el haz de rayos X incidente. En la figura 3.20 las líneas horizontales representan un conjunto de planos cristalinos un conjunto de planos cristalinos paralelos con índices de Miller (hkl). Cuando un haz incidente de rayos X
Fig. 3.19 Niveles electrónicos de energía en el molibdeno, mostrando el ______________________________________________________________________ 72 P.D-S
origen de la radiación K α y K β . monocromáticos de longitud de onda λ golpea este conjunto de planos con un ángulo tal que el diagrama de ondas del haz deja los diversos planos en una situación fuera de fase, no se producirá haz reforzado alguno (fig. 3.20a). De este modo tienen lugar interferencias destructivas. Si los diagramas de ondas reflejados del haz dejan a los diversos planos de fase, entonces se producirá un reforzamiento del haz o interferencia constructiva (fig. 3.20b). Consideremos a los rayos X incidentes 1 y 2 como se indican en la figura 3.20c. Para que estos rayos estén en la fase, la distancia extra de recorrido del rayo 2 es igual a MP + Pn, que debe ser un número entero de longitudes de onda λ . De este modo,
nλ = MP + PN
donde
n = 1,2,3,... , y se conoce como orden de la difracción. Puesto que ambos MP y
d
NP son iguales a d hkl senθ , donde hkl es el espaciado interplanar de los planos cristalinos de índices (hkl) la condición para interferencia constructiva (p.e., la producción de un pico de difracción de radiación intensa) debe ser
nλ = 2d hkl senθ
Esta ecuación, conocida como Ley de Bragg establece la posición entre las posiciones angulares de los haces difractados reforzados en términos de longitud de onda λ de la
d
radiación de rayos X incidente y de los espaciados interplanares hkl de los planos cristalinos. En la mayor parte de los casos, se utiliza el primer orden de difracción donde n = , y asi, para este caso, la Ley de Bragg adopta una forma:
λ = 2d hkl senθ
Ejemplo Una muestra de Fe BCC colada en un difractómetro es sometida a rayos X incidentes con una longitud de onda λ = 0,154 nm . Se obtiene difracción de los planos {110} a 2θ = 44,704° . Calcular un valor para la constante de red a del hierro BCC. (Considérese una difracción de primer orden con n = 1) Solución:
2θ = 44,704° θ = 22,35°
λ = 2d hkl senθ d110 =
λ 2 senθ
=
0,1541 nm = 0,2036 nm 2(0,3803)
Reordenando la ecuación tendremos
______________________________________________________________________ 73 P.D-S
a = d hkl h 2 + k 2 + l 2 de este modo,
α ( Fe) = d110 12 + 12 + 0 = 0,287 nm Análisis de difracción de rayos X por el método de polvo. La técnica más comúnmente utilizada de difracción de rayos X es el método de polvos. En esta técnica se utiliza una muestra pulverizada a fin de que se produzca una orientación al azar de muchos cristales que asegure que algunas de las partículas estén orientadas en el haz de rayos X que tiene un contador de radiación para detectar el ángulo y la intensidad del haz difractado (fig. 3.21). Un registrador representa automáticamente la intensidad del haz difractado mientras el contador se mueve a lo largo de un goniómetro de círculo que está sincronizado con la muestra en un rango próximo a los valores de 2θ (fig. 3.22): la figura 3.31 muestra un registro de difracción de rayos X para la intensidad del haz difractado frente a los ángulos de difracción de 2θ para una muestra de metal puro pulverizado. De esta forma los ángulos de los haces difractados y sus intensidades pueden ser registrados a la vez. Algunas veces se utiliza una cámara de polvo con un rollo de película en vez de un difractómetro, pero este método es mucho más lento y en la mayoría de los casos, menos conveniente.
Condiciones de difracción para celdillas de unidad cúbicas Las técnicas de difracción de rayos X, permiten determinar las estructuras de los sólidos cristalinos. La interpretación de los datos de difracción de rayos X para la mayoría de las sustancias es compleja y no está en los propósitos de este apuntes, por eso sólo se considerará el caso sencillo de difracción en metales de estructura cúbica pura. El análisis de difracción de rayos X para celdillas de unidad cúbicas puede ser simplificado combinando la ecuación
d hkl =
a h2 + k 2 + l 2
______________________________________________________________________ 74 P.D-S
Fig. 3.20 Reflexión de un haz de rayos X por los planos (hkl) de un cristal. (a) Para ángulos arbitrarios de incidencia no se produce reflexión alguna. (b) Para el ángulo de Bragg los rayos reflejados están en la fase y se refuerzan mutuamente. (c) Similar a (b) con la excepción de que se ha omitido la representación de la onda. con la ecuación de Bragg λ = 2dsenθ , obteniendo
λ=
2a ⋅ senθ
h2 + k 2 + l 2
Esta ecuación puede ser utilizada con los datos de difracción de rayos X para determinar si una estructura cristalina es cúbica centrada en el cuerpo o cúbica centrad en las caras. Para emplear la ecuación anterior, en el análisis de difracción, debemos saber que planos del cristal son los planos de difracción para cada tipo de estructura cristalina. Para la ______________________________________________________________________ 75 P.D-S
red cúbica simple, son posibles reflexiones desde todos los planos (hkl). Sin embargo para la estructura BCC la difracción ocurre sólo sobre los planos cuyos índices de Miller sumados (h + k + l ) nos da un número par (tabla 3.7). En el caso de la estructura cristalina FCC, los planos principales de difracción son aquellos cuyos índices de Miller son todos pares o todos impares (cero es considerado par). De este modo, para la estructura cristalina FCC, los planos difractantes son {111}, {200}, {220}, ...etc., que están enumerados en la tabla 3.7.
Fig. 3.21 Difractómetro de Rayos X automatizado.
Interpretación de los datos experimentales de difracción de rayos X para metales con estructuras cúbicas simples. Podemos utilizar datos de difractómetros de rayos X para determinar estructuras cristalina. Un caso sencillo que permite ilustrar esto es la utilización de estos datos para diferenciar entre las estructuras BCC y FCC de un metal cúbico. Supongamos un metal que tiene una estructura cristalina BCC o FCC y que nosotros somos capaces de identificar los planos principales de difracción y sus correspondientes valore 2θ, como se indica para el metal tungsteno en la figura 3.31. Elevando al cuadrado ambos lados de la ecuación 3.11 y despejando sen2θ, obtenemos
sen θ = 2
λ2 (h 2 + k 2 + l 2 ) 4a 2
A partir de los datos de difracción de rayos X podemos obtener valores experimentales de 2θ para una serie de planos difractantes {hkl} . Puesto que la longitud de onda de la radiación emitida y la constante de red a son dos valores constantes podemos eliminar estos valores calculando la relación de dos valores de sen2θ,
( (
sen 2θ A h2 A + k 2 A + l 2 A = 2 sen 2θ B h A + k 2B + l 2B
) )
donde θA y θB son dos ángulos de difracción asociados con los planos principales de difracción {hAkAlA} y {hBkBlB} respectivamente. ______________________________________________________________________ 76 P.D-S
Utilizando la ecuación 3.13 y los índices de Miller de la primera y segunda serie de planos principales difractantes enumerados en la Tabla 3.7 para estructuras BCC y FCC, podemos determinar valores para los cocientes sen2θ para ambas estructuras BCC y FCC. TABLA 3.6 REGLAS PARA LA DETERMINACIÓN DE LOS PLANOS DE DIFRACCIÓN {hkl}EN CRISTALES CÚBICOS. Redes de Bravais Reflexiones presentes Reflexiones ausentes BCC (h + k + l) = pares (h + k + l) = impares FCC (h,k,l) todas pares o todas (h,k,l) no todas pares ni todas impares. impares.
Fig. 3.22 Ilustración esquemática del método del difractómetro de análisis cristalino y de las condiciones necesarias para la difracción. Para la estructura cristalina BCC las dos primeras series de planos difractantes son los planos {110} y {200} (Tabla 3.7). Sustituyendo los índices de Miller {hkl} de estos planos en la ecuación 3.13 se obtiene
( (
) )
12 + 12 + 0 2 sen 2θ A = 2 = 0,5 2 + 02 + 02 sen 2θ B De este modo, si la estructura cristalina del metal cúbico desconocido es BCC la relación entre los valores de sen2θ correspondientes a los dos primero planos principales de difracción será 0,5. Para la estructura cristalina FCC las dos primeras series de planos difractantes son los planos {111} y {200} (Tabal 3.7). Sustituyendo los índices de Miller {hkl} de estos planos en la ecuación 3.13 se obtiene
( (
) )
12 + 12 + 12 sen 2θ A = 2 = 0,75 2 + 02 + 02 sen 2θ n
______________________________________________________________________ 77 P.D-S
TABLA 3.7 INDICES DE MILLER DE PLANOS DE DIFRACCIÓN PARA REDES BCC Y FCC. Planos cúbicos 2 2 2 Suma Planos cúbicos h +k +l difractantes {hkl} 2 2 2 {hkl} FCC BCC Σ (h + k + l ) 2 2 2 {100} 1 +0 +0 1 2 2 2 {110} 1 +1 +0 2 ... 110 3 111 {111} 12 + 12 + 12 4 200 200 {200} 22 + 02 + 02 5 {210} 22 + 12 + 02 6 ... 211 {211} 22 + 12 + 12 ... 8 220 220 {220} 22 + 22 + 02 {221} 22 + 22 + 12 9 10 ... 310 {310} 32 + 12 + 02 Por tanto, si la estructura cristalina del metal cúbico desconocido es FCC la relación entre los valores de sen2θ correspondientes a los dos primeros planos principales de difracción será 0,75.
______________________________________________________________________ 78 P.D-S
Referencias Bibliográficas Fundamentos de la ciencia e ingeniería de materiales / William F. Smith ; traducción Alicia Larena Pellejero. Madrid: McGraw-Hill, 1998. Introducción a la ciencia e ingeniería de los materiales / William D. Callister. Barcelona: Editorial Reverté, S.A., 1995-2001.
______________________________________________________________________ 79 P.D-S
4. Dislocaciones y fenómenos de deslizamiento 4.1. La discrepancia entre el límite de fluencia teórico y el observado en los cristales En la Fig. 4.1 se muestra la curva de tensión-deformación de un cristal típico de magnesio simple, orientado con el plano basal inclinado en 45º del eje de tensión y deformado en tensión. Al bajo esfuerzo de tensión de 7 kg/cm, el cristal se deforma plásticamente y entonces se alarga fácilmente en forma de una cinta angosta que puede ser
Fig. 4.1 Curva deformación-tensión para un cristal de magnesio simple.
Fig. 4.2 Líneas de deslizamiento sobre el cristal de magnesio. cuatro o cinco veces más larga que el cristal original. Si examinamos la superficie del cristal deformado, podremos ver marcas que corren más o menos continuamente alrededor de la probeta en forma de elipses. (Véase la Fig. 4.2). Estas marcas, si se les observa a muchos aumentos se reconocen como manifestaciones visibles de una serie de finos escalones que se han formado sobre la superficie. La naturaleza de estos escalones se muestra esquemáticamente en la Fig. 4.3. Evidentemente, como un resultado de la fuerza aplicada, los cristales han sido cizallados en cierto número de planos paralelos. Además, del análisis cristalográfico de las marcas muestra que éstas son planos basales (0002) y, por lo tanto, los planos más compactos del cristal. Cuando ocurre este tipo de deformación, se ______________________________________________________________________ 80 P.D-S
dice que el cristal experimenta un “deslizamiento”, las marcas visibles sobre la superficie se denominan líneas de deslizamiento, o huellas de deslizamiento, y el plano cristalográfico sobre el cuál ha ocurrido el cizallado se llama plano de deslizamiento.
Fig. 4.3 (A) Vista esquemática aumentada de líneas de deslizamiento (vista lateral). (B) Vista esquemática aumentada de líneas de deslizamiento (vista frontal)
Fig. 4.4 Posición inicial de los átomos sobre un plano de deslizamiento. El esfuerzo cortante al cual comienza el flujo plástico en un cristal simple es asombrosamente pequeño cuando se le compara con la resistencia al corte teórico del cristal perfecto (calculado en términos de fuerzas cohesivas de los átomos). Se puede obtener una estimación de esta resistencia en la siguiente manera. La Fig. 4.4 muestra dos planos adyacentes de un cristal hipotético. Un esfuerzo cortante, actuando como se indica por los vectores marcados Ss , tiende a mover a la izquierda a los átomos del plano superior. Cada átomo del plano superior se eleva a su posición máxima (Fig. 4.5) según se desliza sobre su vecino en el plano de abajo. Esta posición máxima representa un punto de caballete, pues ahora se promoverá un movimiento continuado hacia la izquierda por las fuerzas que tiran del átomo hacia la cavidad siguiente. Un corte de una distancia atómica requiere que los átomos del plano superior en la Fig. 4.4 sean llevados a una posición equivalente de la Fig. 4.5, después de lo cual se mueven espontáneamente hacia la siguiente posición de equilibrio. Para alcanzar el punto del caballete, se requiere un movimiento horizontal de cada átomo igual a un radio atómico. En la Fig. 4.6 se muestra este movimiento. Como la separación entre los dos planos es del orden de dos radios atómicos, la deformación por esfuerzos cortante en el punto de caballete es aproximadamente igual a una mitad. Esto es, ______________________________________________________________________ 81 P.D-S
ε≈
a 1 ≈ 2a 2
Fig. 4.5 El punto de caballete para el corte de un plano de átomos sobre otro. En donde ε es la deformación por esfuerzo cortante. En un cristal perfectamente elástico, la relación del esfuerzo cortante a la deformación por cizallamiento es igual al módulo de corte:
S s = Gε
con ε la deformación por cizallamiento, Ss es el esfuerzo cortante, y G es el módulo de corte. Sustituyendo el vaor de ½ para ε , la deformación por esfuerzo de corte, y el valor 2500000 lb/plg2 para G, que es del orden de la magnitud del módulo de corte para el magnesio, obtenemos para Ss el esfuerzo en el punto de caballete,
2.5 × 10 6 Ss = ≅ 10 6 2
lb/plg2
Fig. 4.6 El corte en el punto de caballete es aproximadamente a/b o ½. La relación del esfuerzo teórico para comenzar el corte del cristal al observado en un cristal real es, por lo tanto, aproximadamente
106 ≅ 10000 10 2 En otras palabras, el cristal se deforma plásticamente a tensiones de 1/10000 de su resistencia teórica. De manera similar ocurre con otros metales, los cristales reales se deforman a pequeñas fracciones de su resistencias teóricas (1/1000 a 1/10000).
______________________________________________________________________ 82 P.D-S
4.2. Dislocaciones La explicación de la discrepancia entre las cargas de deformación aparente y real descansa en el hecho de que los cristales reales no son perfectos sino que contienen defectos. El tipo de defecto que hace posible una explicación del bajo límite elástico de los cristales se denominan dislocación. Hay dos orientaciones básicas en una dislocación la de borde y la helicoidal. En la Fig. 4.7 se muestra esquemáticamente una dislocación de borde en un cristal cúbico simple. La línea SP representa el plano de deslizamiento del cristal. Las líneas de trazos se dibujaron para representar planos cristalinos normales al plano de deslizamiento. El plano marcado a en la parte superior del dibujo termina en el plano b sobre el plano de deslizamiento mientras que los planos a los lados de a van continuamente desde la parte superior hasta la inferior de la figura. En un caso como este, donde un plano reticular termina dentro de un cristal, el resultado es una dislocación de borde. Debe observarse que la dislocación de la Fig. 4.7 representa un defecto que corre completamente a través del cristal, desde la parte delantera hasta la posterior. La Fig. 4.8 ilustra cómo se mueve la dislocación anterior a través del cristal bajo un esfuerzo de corte aplicado que se indica por los vectores SS. Como resultado del esfuerzo aplicado, el átomo c puede moverse a la posición marcada c’ en la Fig. 4.8B. Si lo hiciese, la dislocación se movería una distancia atómica hacia la izquierda.
Fig. 4.7 Una dislocación de borde
______________________________________________________________________ 83 P.D-S
Fig. 4.8 Tres estados en el movimiento de una dislocación de borde a través de un cristal. El plano x, en la parte superior de la figura, corre ahora continuamente de arriba hasta el fondo del cristal, mientras que el plano y termina abruptamente en el plano deslizante. La aplicación continuada del esfuerzo causará que la dislocación se mueva a pasos repetidos a lo largo del plano de deslizamiento del cristal. El resultado final es que el cristal se corta a través del de deslizamiento por una distancia atómica, como se muestra en la Fig. 4.8C. Cada paso en el movimiento de la dislocación, como puede verse en la Fig. 4.8A y B, requiere sólo una ligera redisposición de los átomos en la vecindad del plano extra. Como resultado, una fuerza muy pequeña moverá una dislocación. Cálculos teóricos muestran que esta fuerza es de la magnitud correcta que motiva la bajas cargas de deformación de los cristales. Las dislocaciones fueron admitidas originalmente como postulados porque eran capaces de explicar el bajo límite elástico aparente de los metales, y por muchos años no hubo evidencia experimental independiente que probase su existencia. En los últimos años, sin embargo, se han hecho experimentos que prueban la existencia de las dislocaciones más allá de una duda razonable. El movimiento de una dislocación simple a través de un cristal produce un escalón sobre la superficie cuya profundidad es de una distancia atómica. Como una distancia atómica en una cristal metálico es del orden de unas cuantas unidades Ángstrom, tal escalón no será visible a cierta vista. Para poder producir una línea de deslizamiento visible se deberían producir muchos cientos o miles de dislocaciones a través de un plano de deslizamiento. Inmediatamente se proporcionará un mecanismo para mostrar cómo es posible producir este número de dislocaciones sobre un plano de deslizamiento simple dentro de un cristal. Primero, sin embargo, es necesario definir una dislocación helicoidal, la cual se muestra esquemáticamente en la Fig. 4.9A, donde puede considerarse que cada pequeño cubo representa un átomo. La Fig. 4.9B representa al mismo cristal con la posición de la línea de dislocación marcada por la línea DC. El plano ABCD es el plano de deslizamiento. La parte frontal superior del cristal ha sido cizallada por una distancia atómica a la izquierda relativa ______________________________________________________________________ 84 P.D-S
a la porción frontal inferior. La definición “helicoidal” para este defecto reticular se deriva del hecho de que los planos reticulares del cristal forman una espiral en la línea de dislocación DC. Esta afirmación se puede probar comenzando en el punto x en la Fig. 4.9A, siguiendo entonces hacia arriba y alrededor del cristal en dirección de las flechas. Un circuito del cristal termina en el punto y; los circuitos continuados terminarán finalmente en el punto z.
Fig. 4.9 Dos representaciones de una dislocación helicoidal. Obsérvese que los planos en esta dislocación forman un espiral alrededor de la dislocación en la forma de un tornillo de rosca a la izquierda. Las dislocaciones de borde mostrada en la Fig. 4.7 tiene un plano incompleto que queda sobre el plano deslizante. Es posible también tener el plano incompleto por debajo del plano deslizante. Los dos casos son diferenciados llamando al primero dislocación de borde positiva y al último dislocación de borde negativa. Los símbolos que representan a estas respectivamente, donde la línea horizontal representa al plano dos formas son ⊥ y deslizante y la vertical al plano incompleto. Hay también dos formas de dislocaciones helicoidales. La dislocación helicoidal mostrada en la Fig. 4.9 tiene planos reticulares que forman una espiral sobre la línea DC en forma semejante a un tornillo de rosca a la izquierda. Una dislocación helicoidal igualmente probable es donde la red se forme en espiral hacia la derecha alrededor de la línea de dislocación. Ambas formas de dislocaciones de borde y helicoidales se muestran en la Fig. 4.10. La figura ilustra también la manera en que los cuatro tipos se mueven bajo el mismo esfuerzo de corte aplicado (indicado por los vectores SS). Como se mencionó previamente, la Fig. 4.10 muestra que una dislocación de borde positiva se mueve hacia la izquierda cuando la mutad superior de la red se cizalla a la izquierda. Por otra parte, una dislocación de borde negativa se mueve hacia la derecha, pero produce idéntico corte del cristal. La figura muestra también que la helicoidal a la derecha se mueve hacia delante y la helicoidal izquierda hacia atrás, produciéndose también el mismo corte de la red. En los ejemplos anteriores, se ha supuesto que las líneas de dislocación corren como líneas rectas a través del cristal. Es una consecuencia de la naturaleza básica de las dislocaciones que no puedan terminar en el interior del cristal. Así, el plano extra de una dislocación de borde puede extenderse sólo parte del camino a través del cristal, como se muestra en la Fig. 4.11, y su borde trasero b forma entonces una segunda dislocación de borde. Los dos segmentos de dislocación a y b forman de esta manera un paso continuo a través del cristal desde la superficie frontal a la superior.
______________________________________________________________________ 85 P.D-S
Fig. 4.10 Sentidos en que se mueven las cuatro orientaciones básicas de una dislocación bajo la misma carga aplicada: (A) Borde positivo, (B) Borde negativo, (C) Helicoidal a la izquierda, y (D) Helicoidal a la derecha. También es posible para los cuatro bordes de un plano incompleto quedar en el interior de un cristal, formando una dislocación compacta de cuatro lados en los límites del plano. Además, una dislocación que es de borde en una orientación puede cambiar a helicoidal en otra orientación como se ilustra la en la Fig. 4.12. La Fig. 4.13 muestra la misma dislocación vista desde arriba. Los círculos representan a los átomos justamente debajo del plano de deslizamiento. Obsérvese que la red está cizallada por una distancia atómica en la región del cuarto inferior derecho de la figura confinada por los segmentos de dislocación. Finalmente, una dislocación no necesita ser puramente helicoidal o de borde, sino que puede tener orientaciones intermedias a ambas. Este hecho significa que las líneas de dislocación no tienen que ser rectas, sino que pueden ser curvas.
______________________________________________________________________ 86 P.D-S
Fig. 4.11 Las dislocaciones pueden variar en dirección. Este plano extra sombreado forma una dislocación con componentes de borde a y b.
Fig. 4.12 Una dislocación de dos componentes formada por un componente de borde y uno helicoidal. Considérese la dislocación rectangular cerrada de la Fig. 4.14, consistente en los cuatro tipos elementales de dislocación mostrada en la Fig. 4.10. Los lados a y c son dislocaciones de borde positiva y negativa respectivamente, en tanto que b y d son helicoidales derecha e izquierda, respectivamente. La Fig. 4.10 muestra que, bajo el sentido del esfuerzo cortante indicado, las dislocaciones a y c se mueven a la izquierda y a la derecha respectivamente, en tanto que b y d se mueven hacia delante y hacia atrás, respectivamente. Así, el anillo de dislocación se abre, o se agranda, bajo determinados esfuerzos. (Sin embargo, se cerraría si se invirtiese el sentido del esfuerzo). Debe observarse que el circuito de dislocación abcd no necesita ser rectangular para abrirse bajo el esfuerzo cortante dado. Una curva cerrada, tal como un círculo, se expandiría también en forma similar y cortaría al cristal del mismo modo.
4.3. El foco de Frank-Read Supóngase que una dislocación de borde positiva, que queda en el plano ABCD de la Fig. 4.18, se conecta a otras dos dislocaciones de borde que corren verticalmente a la superficie superior del cristal. Las dos dislocaciones de borde verticales no se pueden mover bajo el ______________________________________________________________________ 87 P.D-S
esfuerzo de corte aplicado. (Sin embargo, se moverán bajo un esfuerzo cortante aplicando a la parte frontal y trasera del cristal). Como el segmento de dislocación xy es borde positivo, el esfuerzo SS tenderá a moverlo hacia la izquierda.
Fig. 4.18 Foco de Frank-Read. El segmento de dislocación xy puede moverse en el plano ABCD bajo el esfuerzo aplicado. Sus extremos x y y, sin embargo, son fijos. Causando que la línea forme un arco con los extremos en los puntos fijos x e y. Este arco está indicado en la Fig. 4.19 por el símbolo a. Una posterior aplicación del esfuerzo ocasiona que la dislocación curvada se expanda a las sucesivas posiciones b y c. En c el anillo se intercepta por sí mismo en el punto m, pero como un segmento de intersección es helicoidal de mano izquierda y el otro es helicoidal de mano derecha, los segmentos se
Fig. 4.19 Varios pasos en la generación de un anillo de dislocación en un foco de Frank-Read. cancelan uno al otro en el punto de intersección. (Cuando formas opuestas de dislocación quedan en el mismo plano de intersección siempre ocurre una cancelación. Este hecho puede ser demostrado fácilmente para el caso de las dislocaciones de borde positivas y negativas puesto que las intersecciones forman un plano reticular completo de dos planos incompletos). La cancelación de los segmentos de dislocación en el punto de contacto m rompe la dislocación en dos segmentos marcados d, uno de los cuales es circular y se expande hasta la superficie del cristal, produciendo un corte de una distancia atómica. El otro componente permanece como un borde positivo regenerado, que queda entre los ______________________________________________________________________ 88 P.D-S
puntos x e y donde está en posición de repetir el ciclo. En esta forma, muchos anillos de dislocación pueden ser generados sobre el mismo plano de deslizamiento, y puede ser producido un corte lo suficientemente grande para que explique el gran tamaño de las líneas de deslizamiento observadas. Un generador de dislocaciones de este tipo recibe el nombre de foco de Frank-Read.
4.4. Nucleación de dislocaciones La evidencia experimental muestra que los focos de Frank-Read existen realmente en los cristales♣. No se conoce que tan importantes son estos generadores de dislocaciones en la deformación plástica de os metales, pero evidencia reciente muestra que las dislocaciones se pueden formar también sin la ayuda de focos de Frank-Read o similares. Si las dislocaciones no se forman por generadores de dislocaciones, entonces deben ser creadas por un proceso de nucleación. Como en todos los fenómenos de esta naturaleza, las dislocaciones pueden ser creadas en dos formas: homogénea o heterogéneamente. En el caso de las dislocaciones, la nucleación homogénea significa que éstas se forman en una red perfecta por la acción de un esfuerzo simple, no requiriéndose otro medio más que el esfuerzo. La nucleación heterogénea, por otra parte, significa que las dislocaciones se forman con la ayuda de defectos presentes en el cristal, posiblemente partículas de impurezas. Los defectos hacen que la formación de dislocaciones sea más fácil por una disminución del esfuerzo requerido para formarlas. Se asume que la nucleación homogénea de las dislocaciones requiere esfuerzos extremadamente altos, esfuerzos que teóricamente son del orden de 1/30 del módulo de corte de un cristal. Como el módulo de corte de un metal es usualmente alrededor de 106 a 107 lb/plg2, el esfuerzo para formar dislocaciones debe ser del orden de 105 lb/plg2. Sin embargo, el esfuerzo de corte real al cual comienzan a deformarse los cristales metálicos por deslizamiento es usualmente alrededor de 100 lb/plg2. Esta evidencia favorece ciertamente la opinión de que si las dislocaciones no se forman por los focos de Frank-Read, entonces deben ser nucleadas heterogéneamente. Los cristales metálicos no son particularmente apropiados para una investigación del fenómeno de nucleación. Cuando se les prepara por solidificación u otros medios, poseen de ordinario una densidad de dislocaciones relativamente elevada en la forma de una red más o menos al azar que se extiende a través de la probeta. Como un punto de interés, los generadores de dislocaciones del tipo de Frank-Read son considerados usualmente una parte de las dislocaciones que crecieron en el cristal. Nuestro interés presente no descansa en estas redes, sino en la creación de nuevos anillos de dislocación independientes. Sin embargo, una concentración elevada de dislocación de crecimiento interior complica la observación de fenómeno de nucleación. Además, en los metales, el deslizamiento ocurre rápidamente de tal forma que una vez alcanzado el límite elástico aparente se forman al mismo tiempo, de ordinario, muchas dislocaciones. Estas dificultades experimentales casi se eliminan si se estudia la nucleación de la dislocación en cristales de fluoruro de litio , el cual es un sal iónica que cristaliza en la red cúbica simple (sal de roca). Este material puede ser preparado en forma de cristales simples con un elevado grado de perfección de manera que tenga una baja densidad de dislocaciones de crecimiento interior (≅ 5×104/cm2). Además, los cristales de LiF son lo suficientemente rígidos a temperatura ambiente para ser manejados sin distorsión, y sólo son ligeramente ♣
Dash, W. C., Dislocations and Mechanical Properties of Crystals, John Wiley and Sons, Inc., 1957. 57.
______________________________________________________________________ 89 P.D-S
plásticos a esta temperatura. En esta forma, con una pequeña tensión (≅ 700 a 1000 lb/plg2) aplicada durante un corto periodo de tiempo, se pueden formar en ellos dislocaciones en corto número controlado.
Fig. 4.20 Las grandes picaduras cuadradas del ataque químico en filas horizontales corresponden a dislocaciones formadas en el LiF a temperaturas ambiente, en tanto que las picaduras más pequeñas, con un espaciado más angosto, que se observan en filas curvadas, crecieron dentro del cristal cuando éste se fabricó. Uno de los mejores y más simples medios de observar dislocaciones en los cristales, es por medio del uso de un reactivo de ataque, que forme una picadura sobre la superficie del cristal en cada punto donde una dislocación intercepte la superficie del cristal. Este método no está exento de dificultades porque a menudo no hay medio de saber si el ataque químico revela todas las dislocaciones, o si alguna de las picaduras se deben a otros defectos. En el fluoruro de litio, el método de la picadura por ataque químico parece ser bastante seguro. Se han desarrollado varias soluciones de ataque para ser empleadas en el LiF, una de las cuales es capaz de distinguir entre dislocaciones de crecimiento interno y dislocaciones de nueva formación. En la Fig. 4.20 puede verse la acción de esta solución. Las grandes picaduras cuadradas que corren en dos filas horizontales están asociadas con las dislocaciones de una nueva formación. Las filas horizontales definen la intercepción del plano de deslizamiento de estas dislocaciones con la superficie. Además de las grandes picaduras, hay dos filas de intersección curvadas de pequeñas picaduras estrechamente espaciadas. Esta últimas delinean lo que se conoce como límite de grano de ángulo pequeño. Los límites consisten realmente en cierto número de dislocaciones estrechamente espaciadas. Debe observarse que la solución de ataque mencionada forma grandes picaduras en las dislocaciones nuevas y pequeñas picaduras en las dislocaciones de la red. La razón para esta habilidad del ataque para distinguir entre estos dos tipos de dislocaciones en la red no se comprende, pero puede ser relacionada con el hecho de que los átomos de impureza tienden a reunirse alrededor de las dislocaciones. Esta segregación de los átomos de impureza no puede ocurrir normalmente en un periodo de tiempo razonable a bajas temperaturas, porque los átomos del sólido no se difunden o mueven con la suficiente ______________________________________________________________________ 90 P.D-S
rapidez a bajas temperaturas para permitirles reunirse alrededor de las dislocaciones. Sin embargo, a temperaturas más elevadas, el movimiento de los átomos de impureza hacia las dislocaciones puede ocurrir con bastante rapidez. Así, las dislocaciones que fueron formadas a temperaturas elevadas tienen mayor probabilidad de tener átomos de impureza
Fig. 4.21 Movimiento de dislocación en el LiF según se revela por ataques químicos repetidos. segregados a su alrededor que las dislocaciones creadas en la red a bajas temperaturas. Esta habilidad de una solución de ataque químico para distinguir entre las dislocaciones de crecimiento interno y las dislocaciones nuevamente formadas es una de las ventajas precisas ofrecidas por el uso del LiF en el estudio del fenómeno de la nucleación. Otra faceta interesante del empleo de las picaduras por ataque químico para observar las dislocaciones en el LiF es que con la técnica apropiada se puede seguir el movimiento de una dislocación bajo la acción de un esfuerzo aplicado. Esto requiere usualmente varias repeticiones del proceso de ataque químico. En esta forma, se ataca primero la superficie de la probeta para revelar las posiciones de las dislocaciones a un tiempo determinado. Las picaduras que se forman se observan de ordinario sobre las superficies {001}. Los cristales de fluoruro de litio se deslizan fácilmente a lo largo de los planos {001}. Sobre este tipo de superficie, las picaduras se forman como pirámides de cuatro lados con un punto agudo en su extremidad inferior. Si ahora se aplica un esfuerzo a la probeta, las dislocaciones se moverán separándose de sus picaduras. Un segundo ataque revelará las nuevas posiciones de las dislocaciones y aumentará las picaduras viejas que presentan las posiciones originales. Sin embargo, los dos juegos de picaduras tienen una apariencia distinta. Las picaduras realmente conectadas con la dislocación tienen siempre extremidades en punta, en tanto que las correspondientes a de donde se han movido las dislocaciones tienen fondos planos. Véase la Fig. 4.21. El trabajo sobre el fluoruro de litio ha mostrado que, en este material particular, las dislocaciones de crecimiento interno usualmente están firmemente ancladas en su lugar y no toman parte en los procesos de deformación plástica. De manera que, los focos de Frank-Read no son activos en el LiF. La inmovilidad de las dislocaciones de la red puede ser acreditada a la presencia de atmósferas de átomos de impurezas que segregan alrededor de cada dislocación. También se ha demostrado experimentalmente que se pueden aplicar esfuerzos muy grandes a los cristales de LiF sin dislocaciones de nucleación homogénea. Por ejemplo, cuando se presiona una pequeña esfera (hecha de vidrio y limpiada cuidadosamente) sobre una región libre de dislocaciones de la superficie del cristal de LiF, es posible alcanzar ______________________________________________________________________ 91 P.D-S
tensiones de corte estimadas en tanto como 110000 lb/plg2 (7733 kg/cm2) y sin embargo no crear todavía dislocaciones. Esta tensión, debe observarse, es más de cien veces mayor que la tensión requerida normalmente para causar fluencia en este material. Se cree además, que aún esta elevada tensión, que estaba limitada por dificultades experimentales debidas a la rotura de la bola de cristal, no define el esfuerzo requerido para nuclear homogéneamente dislocaciones en el LiF. Resulta claro que la nucleación de las dislocaciones por un esfuerzo sin ayuda es muy difícil, a cualquier grado. Debido a que la carga de deformación, o el esfuerzo al que comienzan a moverse normalmente las dislocaciones, es mucho menor que el requerido para nuclear homogéneamente las dislocaciones, es claro que la mayoría de las dislocaciones deben ser nucleadas en forma heterogénea. La conclusión de Gilman es que en el LiF pequeñas heterogeneidades extrañas ocasionan la mayor parte de la nucleación de la dislocación. Las más importantes de éstas son probablemente pequeñas partículas de impureza. Se ha obtenido realmente evidencia experimental para la formación de dislocaciones en las inclusiones de los cristales de LiF. Sin embargo, no se conoce el mecanismo por el cual las inclusiones extrañas nuclean a estos anillos de dislocación. Otro aspecto muy importante del trabajo sobre el LiF es que ha demostrado que las dislocaciones en movimiento pueden nuclear otras dislocaciones. Considérese la Fig. 4.22 donde el dibujo superior representa a un cristal con una dislocación simple que queda en el plano de deslizamiento, delineado por el rayado. La aplicación de un esfuerzo al cristal ocasiona que el anillo se expanda, y, al mismo tiempo, aparezcan nuevas dislocaciones dentro del anillo original, como se muestra en el diagrama inferior. Bajo la aplicación de un esfuerzo continuado, el anillo original se expande a la superficie, en tanto que los anillos internos crecen y nuclean aún a otros anillos. Este procesos desarrolla primero una estrecha banda de deslizamiento que posteriormente crece en anchura según se nuclean las dislocaciones sobre planos de deslizamiento adyacentes. El último resultado es la formación de una banda de deslizamiento (un grupo de líneas de deslizamiento con un espaciamiento muy pequeño). En la Fig. 4.23 se muestran varios juegos de estas bandas. El cuadro de Gilman y sus asociados han producido para el proceso de deslizamiento en el LiF es algo diferente del basado sobre el concepto de los focos de Frank-Read. En el LiF se ha mostrado que las dislocaciones se forman heterogénemente en las discontinuidades de la red. Las últimas son de ordinario partículas de impureza incorporadas dentro del cristal. Los anillos de dislocación que se forman de esta manera se expanden bajo la acción de una carga aplicada y, en su crecimiento, nuclean otras dislocaciones por medio de un mecanismo desconocido. Este mecanismo multiplicador de dislocaciones produce primero líneas estrechas de deslizamiento que crecen hasta formar bandas de deslizamiento, las Figura 4.22 cuales, a su vez, pueden expandirse hasta cubrir todo el cristal. No se ha determinado si un método idéntico es válido o no para el desarrollo de las líneas o bandas de deslizamiento
______________________________________________________________________ 92 P.D-S
Fig. 4.22 En un cristal de fluoruro de litio, un anillo de dislocación en movimiento puede nuclear otros anillos. (A) Pequeño anillo de dislocación sencillo, (B) el mismo anillo expandido por la acción de un esfuerzo mostrando anillos secundarios nucleados por el movimiento del anillo primario. para los metales. Sin embargo, el trabajo sobre el LiF ha demostrado ciertamente que nos encontramos bastante lejos de entender completamente los mecanismos por los que se forman las líneas de deslizamiento.
4.5. Deslizamiento por flexión Durante muchos años se ha sabido que los cristales pueden ser doblados plásticamente y que esta forma de deformación plástica ocurre como resultado del deslizamiento. La flexión de los cristales puede ser explicada en términos de los focos de Frank-Read.
______________________________________________________________________ 93 P.D-S
Fig. 4.23 Bandas de deslizamiento en el LiF. Bandas formadas a –196ºC y 0,36% de deformación. Apliquemos pares iguales (de magnitud M) a los extremos del cristal mostrado en la Fig. 4.24A. El efecto de estos pares es producir un momento de flexión (M) uniforme a lo largo del cristal. Hasta que se exceda el punto del límite elástico aparente, la deformación será elástica. La distribución de esfuerzos a través de cualquier sección transversal, tal como aa es dad por la ecuación
Sx =
My I
en donde y es la distancia vertical medida desde el eje neutral del cristal (línea de centro horizontal), M es el momento de flexión, e I el momento de inercia de la sección transversal del cristal ( πr 4 / 4 para cristales de sección transversal circular). La Fig. 4.24B muestra la distribución de esfuerzos que varía uniformemente desde un esfuerzo de compresión máximo en la superficie superior, a cero en el eje neutral, y a un esfuerzo de tensión máximo en la superficie inferior. La Fig. 4.25 representa al mismo cristal en el que se supone que la línea mn representa el trazo de un plano de deslizamiento. La curvatura del cristal no se muestra, para simplificar la figura. Por conveniencia, se supone también que el plano de deslizamiento es perpendicular al plano del papel y que la línea mn es también la dirección de deslizamiento. Los vectores horizontales asociados con la línea mn representan la misma distribución de esfuerzos que en la Fig. 4.24B. La Fig. 4.25 muestra también, a lo largo de la línea op, el componente de esfuerzo cortante (paralelo al plano de deslizamiento) de la distribución de esfuerzos. Obsérvese que el sentido del esfuerzo cortante cambia su signo según cruza el eje neutral. Además el esfuerzo cortantes cero en el eje neutral y llega a un máximo en los extremos del plano de deslizamiento. Debido a la distribución del esfuerzo cortante, los primeros anillos de dislocación se formarán en los
______________________________________________________________________ 94 P.D-S
Fig. 4.24 (A) Deformación elástica de un cristal sometido a dos momentos iguales (M) aplicados a sus extremos. (B) Distribución normal de esfuerzos sobre un sección transversal tal como aa. focos de Frank-Read o en otros cerca de las superficies inferior y superior. La forma en que se mueven estos anillos de dislocación, sin embargo, depende de si la dislocación queda sobre o por debajo del eje neutral de la probeta. En ambos casos, las componentes de borde positivos de todos los anillos de dislocación se mueven hacia la superficie, mientras que las componentes de borde negativos se mueven hacia el eje neutral de la probeta. (Véase la Fig. 4.26). Las dislocaciones de borde negativas se mueven hacia una región de esfuerzo cortante decreciente y eventualmente deben parar. Las dislocaciones de borde positivas, por otra parte, están en una región de esfuerzos elevados, como son los componentes helicoidales de mano izquierda y de derecha de cada anillo de dislocación. Los tres últimos componentes (borde positivo y helicoidales derecho e izquierdo) se puede suponer que se
Fig. 4.25 Distribución de esfuerzos sobre planos de deslizamiento correspondientes a la deformación elástica mostrada en la Fig. 4.24. mueven hacia la superficie y dejan el cristal. Por ejemplo, bajo la distribución de esfuerzos de flexión aplicados, los anillos de dislocación cerrados originados en los focos de FrankRead se vuelven eventualmente dislocaciones de borde negativas que se mueven hacia el eje neutral del cristal. Según se dobla el cristal más y más, las dislocaciones de borde negativas que se mueven hacia el eje neutral del cristal. Según se dobla el cristal más y más, las dislocaciones de borde negativas serán conducidas cada vez más lejos a lo largo de los planos de deslizamiento hacia el centro del cristal. Eventualmente, en cada plano de deslizamiento activo se hallará una secuencia ordenada de dislocaciones, teniendo éstas una separación más o menos uniforme, cuyo espaciamiento mínimo depende del hecho de que ______________________________________________________________________ 95 P.D-S
las dislocaciones del mismo tipo y signo se repelen mutuamente si quedan sobre el mismo plano de deslizamiento. La Fig. 4.27 ilustra la naturaleza general de la distribución de dislocaciones. La sección estrecha al eje neutral se presenta libre de dislocaciones, de acuerdo con el hecho de que esta región, bajo esfuerzos de flexión moderados, no sufrirá esfuerzos sobre el límite elástico, con lo que la deformación será elástica y no plástica. Ahora, cada dislocación de borde negativa de una secuencia que queda sobre un plano de deslizamiento dado representa un plano extra que termina en el plano de deslizamiento. Cada uno de estos planos queda sobre la izquierda de su plano de deslizamiento. Para poder
Fig. 4.26 Efecto de la distribución de esfuerzos sobre el movimiento, de las dislocaciones. Las componentes de borde positivos se mueven hacia la superficie; los de borde negativos, hacia el eje neutral.
Fig. 4.27 Distribución de un exceso de dislocaciones de borde en un cristal flexionado plásticamente. Acomodar estos planos extra (todos sobre un lado de un plano de deslizamiento dado), los planos de deslizamiento deben asumir una curvatura que es convexa hacia abajo y a la izquierda, y el cristal como un todo una curvatura convexa hacia abajo. Si se invirtiesen los pares aplicados al cristal en la Fig. 4.24 a 4.27, se produciría un exceso de dislocaciones positivas a lo largo de los planos de deslizamiento. Los planos de deslizamiento y el cristal asumirían entonces una curvatura inversa a la descrita anteriormente. En la discusión anterior, se supuso que el cristal era de dimensiones macroscópicas y que la deformación por flexión estaba distribuida uniformemente sobre toda la longitud del cristal. El fenómeno que ha sido descrito no está restringido (sin embargo) a cristales grandes. La flexión de los planos cristalinos por la acumulación de un número excesivo de dislocaciones de borde del mismo signo puede ocurrir en cristales bastante pequeños, e incluso en áreas bastante pequeñas de los cristales. Se pueden explicar cierto número de fenómenos relacionados observados en cristales metálicos en términos de rotaciones localizadas en la red. En cada caso, hay una acumulación de dislocaciones de borde del ______________________________________________________________________ 96 P.D-S
mismo signo sobre planos de deslizamiento del cristal. Entre éstas hay alabeamientos, planos de flexión, y bandas de deformación. Una descripción detallada de lo último sobrepasa el intento del presente texto, pero el hecho de que se observen con frecuencia puntualiza el hecho de que la flexión plástica de los cristales metálicos es un importante mecanismo de deformación.
4.6. Ascenso de las dislocaciones de borde El plano de deslizamiento de una dislocación se define como el plano que contiene tanto la dislocación como el vector de Burguers. Como el vector de Burgers es paralelo a una dislocación helicoidal, cualquier plano que contenga a la dislocación es un posible plano de deslizamiento. (Véase la Fig. 4.28). Por otra parte, el vector de Burgers de una dislocación de borde es perpendicular a la dislocación, y solo hay un posible plano de deslizamiento. (Véase la Fig. 4.29). Una dislocación helicoidal puede moverse por deslizamiento o corrimiento en cualquier dirección perpendicular a sí misma, pero una dislocación de borde sólo puede correrse en su plano de deslizamiento simple. Sin embargo, hay otro método, que se diferencia fundamentalmente del deslizamiento, por el cual se puede mover una dislocación de borde. Este proceso se llama ascenso e implica movimiento en una dirección perpendicular al plano de deslizamiento.
Fig. 4.28 (Izquierda). Cualquier plano conteniendo la dislocación es un plano de deslizamiento para una dislocación helicoidal: La Fig. 4.29 (Derecha). Para una dislocación de borde sólo hay un plano de deslizamiento. Este tiene tanto el vector de Burgers como la dislocación. La Fig. 4.30A representa una vista de una dislocación de borde con un plano extra perpendicular al plano de papel y que se designa por círculos llenos. En este diagrama, un lugar vacante la red se ha movido hacia arriba a una posición justamente a la derecha del átomo de a, uno de los átomos que forma el borde o límite del plano extra. Si el átomo a salta dentro de un lugar desocupado, el borde de la dislocación pierde un átomo, como se muestra en la Fig. 4.30B, donde el átomo c, designado con un círculo cruzado, representa el átomo próximo del borde (quedando justamente por debajo del plano del papel). Si el átomo b y todos los otros que forman el borde original de los planos extras se separan por interacción con los lugares desocupados, la dislocación de borde ascenderá una distancia atómica en una dirección perpendicular al plano de deslizamiento. Esta situación se muestra en la Fig. 4.30C. La ascensión, tal como se ilustra en el ejemplo anterior, se designa como ______________________________________________________________________ 97 P.D-S
Fig. 4.30 Ascenso positivo de una dislocación de borde. una ascensión positiva y resulta en una disminución del tamaño del plano extra. La ascensión negativa corresponde a lo opuesto de lo anterior en que el plano extra crece en tamaño en lugar de contraerse. En las Fig. 4.31A y 4.31B se ilustra un mecanismo para la ascensión negativa. En este caso, supongamos que el átomo a de la Fig. 4.31A se muestra a la izquierda y se une al plano extra, dejando un lugar vacante a su derecha, como se muestra en la Fig. 4.31B. Este lugar vacante se mueve entonces dentro del cristal. Obsérvese que esto es de nuevo un procedimiento de átomo por átomo y no un movimiento cooperativo de toda la fila de átomos que queda detrás del átomo a. Así, el átomo c (círculo cruzado), mostrado en la Fig. 4.31B, representa al átomo que originalmente estaba detrás del átomo a. Un movimiento cooperativo de todos los átomos en la fila detrás de a corresponde a un desplazamiento y no a un ascenso. Debido a que estamos removiendo el material del interior del cristal según se contrae el plano extra, el efecto de ascenso positivo sobre el cristal es el de causar su contracción en una dirección paralela al plano de deslizamiento (perpendicular al plano extra). El ascenso positivo está asociado por lo tanto con una deformación compresiva y será promovido por un componente de esfuerzo compresivo perpendicular al plano extra. Similarmente, un esfuerzo de tensión aplicado perpendicular al plano extra de una dislocación de borde promueve el crecimiento del plano y así el ascenso negativo. En consecuencia, existe un diferencia fundamental entre la naturaleza del esfuerzo que produce deslizamiento y el que produce ascenso. El deslizamiento ocurre como resultado de esfuerzo cortante; el ascenso como resultado de un esfuerzo normal (de tensión o compresión). Tanto el ascenso positivo como el negativo requieren que los lugares vacantes se muevan a través de la red, hacia la dislocación en el primer caso y opuesta a ella en el segundo. Si la concentración de los lugares vacantes y su grado de es muy bajo, entonces no se espera que asciendan las dislocaciones de borde. Como veremos los lugares vacantes en la mayor parte de los metales son prácticamente inmóviles a bajas temperaturas (un salto en once días en el cobre a temperatura ambiente), pero a temperaturas elevadas se mueven con gran rapidez y su número de equilibrio aumenta por muchas potencias de diez. Por lo tanto, el ascenso es un fenómeno que se vuelve importante cada vez más, según aumenta la temperatura. Por otra parte, el deslizamiento sólo es influido ligeramente por la temperatura.
______________________________________________________________________ 98 P.D-S
Fig. 4.31 Ascenso negativo de una dislocación de borde
4.7. Planos de deslizamiento y direcciones de deslizamiento Es un hecho experimental que en los cristales metálicos el deslizamiento, o corrimiento, ocurre preferentemente sobre planos de elevada densidad atómica. Es una regla general que la separación entre planos reticulares paralelos varía directamente con el grado de compacticidad en los planos. En consecuencia, los cristales se cortan con mayor facilidad sobre planos de amplia separación. Esta aseveración no significa que el deslizamiento no pueda ocurrir en un cristal dado sobre planos distintos a los más compactos. Significa más bien que las dislocaciones se mueven con mayor facilidad a lo largo de planos con espaciamiento amplio donde la distorsión reticular debida al movimiento de la dislocación es pequeña. El deslizamiento no sólo tiende a efectuarse de preferencia sobre los planos cristalográficos, sino que en la dirección del corte asociada con el deslizamiento es también cristalográfica. Se ha encontrado que esta dirección de deslizamiento de un cristal (dirección de corte) es casi exclusivamente una dirección compacta, una dirección de la red con átomos dispuestos en una línea recta, tocando cada uno al siguiente. Debe mencionarse también que esta tendencia al deslizamiento ocurrente a lo largo de direcciones compactas es mucho más fuerte que la tendencia a ocurrir sobre los planos más compactados. Para propósitos prácticos, puede suponerse de ordinario que el deslizamiento se produce en una dirección compacta. El hecho de que la dirección de deslizamiento determinada experimentalmente coincida con las direcciones compactas de un cristal puede ser explicado en términos de dislocaciones. Cuando se mueve una dislocación a través de un cristal, éste se corta en una cantidad igual al vector de Burgers de la dislocación. Después de que ha pasado la dislocación, el cristal debe estar sin cambio en la geometría de los átomos, esto es, debe ser retenida la simetría del cristal. El corte menor que puede llenar esta condición es igual a la distancia entre átomos en una dirección compacta.
______________________________________________________________________ 99 P.D-S
Fig. 4.32 Dos sentidos en los cuales puede ser cortada una red cúbica simple mientras todavía mantiene la simetría reticular; (A) El cristal antes del corte, (B) Corte en una dirección compacta, y (C) Corte en una dirección no compacta. Para poder explicar este punto con mayor claridad, consideremos un modelo de bola dura de una estructura cristalina cúbica simple. La línea mn de la Fig. 4.32A es una dirección compacta. En la Fig. 4.32B, la mitad superior de la red ha sido cortada a la derecha por a, la distancia atómica en dirección mn. El corte, por supuesto, no ha cambiado la estructura cristalina. Considérese ahora una dirección que no sea compacta elegida arbitrariamente, tal como qr en la Fig. 4.32A. La Fig. 4.32C muestra que un corte de c (la distancia entre centros de átomos en esta dirección) preserva también la red. Sin embargo, c es mayor que a (c = 1,414a). Además, c y a igualan los respectivos tamaños de los vectores de Burgers de la dislocación capaz de producir los dos cortes. La dislocación correspondiente al corte en la dirección compacta tiene así el vector de Burgers más pequeño. Sin embargo, la distorsión reticular y la energía de deformación asociada con una dislocación son funciones del tamaño del vector de Burgers, y ha sido demostrado por Frank que la energía de deformación varía directamente con el cuadrado del vector de Burgers. En el caso presente, la energía de deformación de una dislocación del vector de Burgers c es el doble de una dislocación del vector de Burgers a [esto es, c2 = 1,4142·a2]. En esta forma, una dislocación con un vector de Burgers igual al espaciamiento de los átomos en una dirección compacta sería única, y poseería la menor energía de deformación de todas las dislocaciones cuyo movimiento a través del cristal no perturba la estructura cristalina. El hecho de que posea la menor energía de deformación deberá hacer a esta forma de dislocación mucho más probable que las formas de energía de deformación más elevada. También deberá tomarse en cuenta el hecho observando experimentalmente que la dirección de deslizamiento en los cristales es casi siempre una dirección compacta. ______________________________________________________________________ 100 P.D-S
4.8. Sistemas de deslizamiento La combinación de un plano de deslizamiento y una de sus direcciones compactas define a un posible modo o sistema de deslizamiento. Si se considera que el plano del papel en la Fig. 4.33 define a un plano deslizante, entonces habrá tres sistemas de deslizamiento asociados con el plano compacto indicado, correspondiendo un modo a cada una de las tres direcciones de deslizamiento. Todos los modos de un plano de deslizamiento dado son equivalentes cristalográficamente. Además, todos los sistemas de deslizamiento en planos de la misma forma [(111), (1-11), (-111) y (11-1)] son también equivalentes. Sin embargo, la facilidad con que se puede producir el deslizamiento sobre sistemas de deslizamiento pertenecientes a planos de formas distintas [(111) y (110)] será, en general, muy diferente.
Fig. 4.33 Las tres direcciones de deslizamiento en un plano compacto. Obsérvese que este tipo de plano ocurre tanto en la red hexagonal compacta como en la cúbica centrada en las caras.
4.9. Esfuerzo cizallante crítico determinado Es un hecho bien conocido que las probetas de metal policristalino poseen un límite elástico que debe ser excedido para producir deformación plástica. También es cierto que los cristales metálicos simples necesitan ser sometidos a un esfuerzo sobre un límite elástico similar antes de que la deformación plástica por deslizamiento sea medible macroscópicamente. Como el deslizamiento es causado por esfuerzos cortantes, el límite elástico para cristales se expresa mejor en términos de un esfuerzos cizallantes determinado sobre el plano de deslizamiento y en la dirección del deslizamiento. Este esfuerzo se denomina esfuerzo cizallante crítico determinado. Es el esfuerzo que ocasionará el movimiento de un número suficientemente grande de dislocaciones en tal forma que se pueda observar una deformación mesurable. La mayor parte de las probetas cristalinas no se prueban directamente en corte, sino en tensión, de manera que ahora se derivará una ecuación que relaciona el esfuerzo de tensión aplicado con el esfuerzo cizallante determinado sobre el plano de deslizamiento y en la dirección del deslizamiento. Concedamos que el plano inclinado en la parte superior del cristal cilíndrico de la Fig. 4.34 corresponda al plano de deslizamiento el cristal. La normal al plano de deslizamiento y la dirección de deslizamiento están indicadas por las líneas p y d respectivamente. El ángulo entre la normal del plano de deslizamiento y el eje de esfuerzos se representa por θ, y el de entre la dirección del deslizamiento y el eje de esfuerzos por φ. La fuerza de tensión axial aplicada al cristal, en libras, se designa por fn. ______________________________________________________________________ 101 P.D-S
El área de la sección transversal de la probeta perpendicular a la fuerza de tensión aplicada es el área del plano de deslizamiento como el coseno del ángulo entre los dos planos. Este ángulo es el mismo que el ángulo entre las normales a los dos planos en cuestión y el ángulo θ en la figura. Así,
Fig. 4.34 Una figura para la determinación de la ecuación del esfuerzo cizallante crítico determinado. En donde An es el área de la sección transversal perpendicular al eje de la probeta, y Asp el área del plano de deslizamiento. El esfuerzo sobre el plano de deslizamiento es igual la fuerza aplicada dividida entre el área del plano de deslizamiento:
sA =
fn f = n cosθ Asp An
donde sA es el esfuerzo sobre el plano de deslizamiento en la dirección de la fuerza original fn. Sin embargo, este no es el esfuerzo de cizallamiento que actúa en la dirección del deslizamiento, sino el esfuerzo total actuando sobre el plano de deslizamiento. La componente de este esfuerzo paralela a la dirección de deslizamiento es el esfuerzo cizallante deseado y se puede obtener multiplicando sA por el cosφ es el ángulo entre sA y ss, el esfuerzo cizallante determinado. Como resultado de lo anterior, podemos escribir ahora
s A = s A cos φ =
fn cosθ cos φ An
en donde ss es el esfuerzo cizallante determinado sobre el plano de deslizamiento en la dirección del deslizamiento. Finalmente, como fn / An es la fuerza de tensión aplicada dividida entre el área normal a esta fuerza, se puede reemplazar este término por sn, el esfuerzo de tensión normal:
ss = sn cosθ cos φ
______________________________________________________________________ 102 P.D-S
De la ecuación anterior se pueden extraer varias conclusiones importantes. Si el eje tensor es perpendicular al plano de deslizamiento, el ángulo de φ es 90º y el esfuerzo cizallante es nuevamente cero. Por tanto, no es posible producir deslizamiento sobre un plano dado cuando éste es perpendicular o paralelo al eje del esfuerzo tensor. El máximo esfuerzo cizallante que se puede producir es igual a 0,5·sn y ocurre cuando tanto θ como φ son iguales a 45º. Para todas las demás combinaciones de estos dos ángulos, el esfuerzo cizallante determinado es menor de la mitad del esfuerzo de tensión. Por pruebas en muchos metales diferentes, se ha verificado experimentalmente que el esfuerzo cizallante resuelto para un plano cristalográfico dado es independiente de la orientación del cristal. Así, si un número de cristales, difiriendo sólo en la orientación del plano de deslizamiento con el eje del esfuerzo tensor, son sometidos a tensión, y se calcula con la ecuación anterior el esfuerzo cizallante al que ceden, se hallará que la carga de deformación es una constante. La Fig. 4.35 muestra los datos del esfuerzo cizallante crítico determinado de Burke y Hibbard para cristales de magnesio simples de 99,99% de pureza.
Fig. 4.35 El límite elástico en tensión para cristales simples de magnesio con orientaciones diferentes. Las abscisas son valores de la función cosθ·cosφ. La curva suave es para una constante supuesta del esfuerzo cizallante crítico determinado de 63 lb/plg2 (4.42 kg/cm2) La ordenada para esta curva es el esfuerzo de tensión al cuál se observó la cedencia, mientras que las abcisas dan los valores correspondientes de la función cosθcosφ. Se trazó una curva suave a través de los datos correspondientes a una carga de deformación constante (esfuerzo cizallante) de 44 g/mm2 (62 lb/plg2). Los puntos experimentales caen sobre esta curva con precisión extraordinaria. El esfuerzo cizallante crítico determinado para deslizamiento sobre un tipo de plano dado es notablemente constante para cristales de la misma composición y tratamiento previo. Sin embargo, el esfuerzo cizallante crítico resuelto es sensible a los cambios en la composición y manejo. Generalmente, cuánto más puro es el metal más baja será la carga de deformación, como puede verse con bastante claridad en las curvas de la Fig. 4.36 para cristales simples de plata y cobre. Los datos de la plata en particular muestran que ______________________________________________________________________ 103 P.D-S
cambiando la composición de una pureza de 99,99% a una de 99,93% se eleva el esfuerzo cizallante crítico determinado por un factor mayor de tres. El esfuerzo cizallante crítico determinado e suna función de la temperatura. En el caso de los cristales cúbicos centrados en las caras, esta dependencia de la temperatura puede ser pequeña. Los cristales metálicos que pertenecen a otras formas cristalinas (BCC, Hexagonal y romboédrica) muestran un mayor efecto de la temperatura. En estos cristales, la carga de deformación aumenta según disminuye la temperatura, con una proporción de aumento que generalmente se hace mayor según desciende la temperatura. La Fig. 4.37 muestra este efecto para cierto número de diferentes metales cúbicos no centrados en las caras.
4.10.
Deslizamiento sobre sistemas de deslizamiento equivalente
Se ha determinado empíricamente que cuando un cristal posee varios sistemas de deslizamiento cristalográficamente equivalentes, el deslizamiento comenzará primero sobre el sistema que tenga el mayor esfuerzo cizallante resuelto. Se ha encontrado también que si se somete a esfuerzos iguales a varios sistemas equivalentes, el deslizamiento comenzará de ordinario simultáneamente sobre todos estos sistemas.
Fig. 4.37 Efecto de la temperatura sobre el esfuerzo cizallante crítico. Nota: Los datos sobre los que están basadas estas curvas son anteriores a la Tabla 4.2. Los esfuerzos críticos más elevados en este caso corresponden a cristales de pureza inferior.
4.11.
Sistemas de deslizamiento en diferentes formas cristalinas
Metales Cúbicos Centrados en las Caras. Las direcciones compactas son las <110> en la estructura cúbica centrada en las caras. Estas son direcciones que corren diagonalmente a través de las caras de la celda unitaria. La Fig. 4.33 muestra un segmento de un plano compacto. En la red cúbica centrada en las caras hay cuatro de estos planos, llamados planos octaédricos, con índices (111), (1-11), (11-1) y (-111). Cada plano octaédrico contiene tres direcciones compactas, como se puede ver en la Fig. 4.33, y, en consecuencia, el número total de sistemas octaédricos de deslizamiento es de 4×3 = 12. El número de sistemas octaédricos de deslizamiento puede ser calculado también en forma diferente. Hay 6 direcciones <110> y, como cada dirección compacta queda en dos planos octaédricos, el número de sistemas de deslizamiento es, por tanto, doce. ______________________________________________________________________ 104 P.D-S
Los únicos sistemas de deslizamiento importantes en la estructura cúbica centrada en las caras son los asociados con el deslizamiento en el plano octaédrico. Hay varias razones para esto, primero, el deslizamiento puede ocurrir con mayor facilidad sobre un plano compacto que sobre planos de menor densidad atómica, esto es, el esfuerzo cizallante crítico determinado en los metales de red cúbica centrada en las caras es muy pequeño en las cercanías del estado puro. TABLA 4.1 ESFUERZO CIZALLANTE CRÍTICO DETERMINADO PARA METALES DE RED CÚBICA CENTRADA EN LAS CARAS Metal Pureza Sistema de Esfuerzo cizallante deslizamiento crítico determinado lb/plg2 Cu 99.999 {111}<110> 92 Ag 99.999 {111}<110> 54 Au 99.99 {111}<110> 132 Al 99.996 {111}<110> 148 Generalmente, los cristales cúbicos centrados en las caras deformados plásticamente se deslizan sobre más de un plano octaédrico debido al gran número de sistemas equivalentes de deslizamiento. De hecho, es muy difícil producir deformaciones de más de unos cuántos porcentajes, aun en un ensayo a la tensión simple, sin inducir simultáneamente corrimiento sobre varios planos. Sin embargo, cuando ocurre deslizamiento al mismo tiempo sobre varios planos de deslizamiento intersectantes, el esfuerzo requerido para producir deformaciones adicionales se eleva rápidamente. En otras palabras, la resistencia cristalina a la deformación aumenta. La Fig. 4.38 muestra curvas típicas de esfuerzo-deformación para un par de cristales cúbicos de centrado en las caras. La curva a corresponde a un cristal cuya orientación original es tal, que varios sistemas de deslizamiento tienen iguales esfuerzos cizallantes determinados. En este caso, la deformación plástica ocurre por deslizamiento sobre varios planos deslizantes y la curva tiene una fuerte pendiente desde el comienzo de la deformación. Por otra parte, la curva b es representativa de cristales en los que el plano de deslizamiento se encuentra sometido a mayores esfuerzos que todos los demás al comienzo de la deformación. La región marcada 1 en esta curva corresponde al deslizamiento en este plano únicamente; los otros planos de deslizamiento se encuentran inactivos. La pequeña inclinación de la curva en el paso 1 muestra que el aumento de endurecimiento por deformación es menor cuando el deslizamiento ocurre sobre un plano cristalográfico simple. La región 2 de la curva b, que aparece después de varios porcentajes
______________________________________________________________________ 105 P.D-S
Fig. 4.38 Curvas de esfuerzo-deformación típicas de los cristales cúbicos simples centrados en las caras. La curva a corresponde a la deformación por corrimiento múltiple después de un período de deslizamiento simple (corrimiento fácil). de deformación, tiene una inclinación más pronunciada y el cristal aumenta en resistencia rápidamente con el incremento de deformación. En esta región, cesa el deslizamiento sobre un plano simple, comenzando los corrimientos múltiples sobre planos de deslizamiento intersectantes que aumentan el endurecimiento de la deformación. La región 1 de la curva b, donde ocurre el deslizamiento sobre un plano simple, se conoce como la región de corrimiento fácil. La extensión de esta región de corrimiento fácil depende de varios factores, entre los cuales está el tamaño de la probeta y la pureza del metal. Cuando el diámetro de la sección transversal de una probeta cristalina es grande, o el metal es muy puro, la región de corrimiento fácil tiende a desaparecer. En cualquier caso, la región de corrimiento fácil, o deslizamiento simple, raramente excede las deformaciones de varios porcentajes en los cristales cúbicos de centrado en las caras, y, para cualquier propósito práctico, puede suponerse que estos metales se deforman por corrimientos múltiples sobre cierto número de sistemas octaédricos. Esta deformación es especialmente cierta en el caso de los metales cúbicos de centrado en las caras policristalinos. Las propiedades plásticas de los metales cúbicos de centrado en las caras son las siguientes: los bajos esfuerzos cizallantes críticos determinados para el deslizamiento sobre los planos octaédricos significan que la deformación plástica de estos metales comienza a bajos niveles de deformación. Sin embargo, los deslizamientos múltiples sobre planos de deslizamiento intersectantes ocasionan una rápida resistencia debido al endurecimiento por deformación según prosigue ésta. Metales Hexagonales. Como el plano basal de los cristales hexagonales compactos y el plano octaédrico {111} de la red cúbica centrada en las caras tienen una disposición de átomos idéntica, debe esperarse que el deslizamiento sobre el plano basal de los metales hexagonales ocurra tan fácilmente como el deslizamiento sobre los planos octaédricos de los metales cúbicos de centrado en las caras. En el caso de los tres metales hexagonales, cinc, cadmio, y magnesio, este es realmente el caso. La Tabla 4.2 enlista el esfuerzo de tensión cizallante críticos determinado para el deslizamiento basal de esto metales medido a temperatura ambiente. Los índices hexagonales de Miller del plano basal son (0001), y las direcciones compactas, o de deslizamiento, son <11-20>. La Tabla 4.2 confirma en forma definitiva que la deformación plástica por deslizamiento basal en estos tres metales hexagonales comienza a esfuerzos del mismo orden de magnitud ______________________________________________________________________ 106 P.D-S
que los requeridos para comenzar el deslizamiento en los metales cúbicos de centrado en las caras. TABLA 4.2 ESFUERZO CIZALLANTE DESLIZAMIENTO BASAL. Metal Pureza Cinc
99.999 99.999 99.99
CRITICO
DETERMINADO
Sistema de deslizamiento
{111}<110> {111}<110> {111}<110>
PARA
Esfuerzo cizallante crítico determinado lb/plg2 92 54 132
Otros dos metales de interés son el titanio y el berilio en los cuales el esfuerzo cizallante crítico determinado a temperatura ambiente para deslizamiento basal es muy elevado (aproximadamente 16000 lb/plg2 1125 kg/cm2 en el caso del titanio, y 5700 lb/plg2 401 kg/cm2). En consecuencia, el último plano es el plano de deslizamiento preferido en el titanio. El deslizamiento basal del zirconio, otro metal también hexagonal, no ha sido observado hasta tal punto. Parece que el deslizamiento ocurre primordialmente sobre sistemas de deslizamiento {10-10} <11-20>. El esfuerzo cizallante crítico para esta forma de deslizamiento es alrededor de 900 lb/plg2 (499 kg/cm2). La pregunta que se presenta ahora es cómo se pueden explicar las diferencias en el comportamiento al deslizamiento del magnesio, cinc, y cadmio, por una parte, y las de berilio, titanio, y zirconio por la otra. No se tiene a mano una completa solución a este problema, pero lo siguiente está relacionado sin duda con este efecto. La Fig. 1.14 del Cap. 1 muestra la celda unitaria de la red hexagonal. En esta figura, la distancia a es igual a la distancia entre los átomos en el plano basal, en tanto que c es la distancia vertical entre átomos en cualquier otro plano basal. La relación c/2a es, por tanto, una medida sin dimensión determinada del espaciamiento entre planos basales. Si los átomos de los metales hexagonales fuesen realmente de forma esférica, la relación c/2a sería la misma en todos los casos 80,816). La Tabla 4.3, sin embargo, muestra que este valor no es el mismo, sino que varía desde 0,943 en el caso del cadmio a 0,793 en el del berilio. Únicamente el magnesio tiene un átomo que se acerca a la forma esférica verdadera, c/2a = 0,812. El cadmio y el cinc tienen una separación de plano basal más grande que la de esferas compactas, mientras que el berilio, titanio y zirconio tienen una similar. Es significativo que los metales hexagonales con separaciones pequeñas entre los planos basales sean aquellos con esfuerzos cizallantes críticos muy altos para deslizamiento basal.
TABLA 4.3 RELACIÓN c/2a PARA METALES HEXAGONALES. Metal c/2a Cd 0.943 Zn 0.928 Mg 0.812 Zr 0.795 ______________________________________________________________________ 107 P.D-S
Ti Be
0.794 0.793
Fig. 4.39 Deslizamiento {1122} <1123> en metales hexagonales. Se ha observado que los metales hexagonales cinc y cadmio se deslizan sobre un plano de deslizamiento único cuando se les deforma en tal manera que se haga muy pequeño el esfuerzo cizallante crítico sobre el plano basal. Esta deformación puede realizarse, por ejemplo, colocando el eje del esfuerzo tensor casi paralelo al plano basal. El plano de deslizamiento observado para este tipo de deformación es {11-22}, en tanto que la dirección de deslizamiento es <-1-123<. La Fig. 4.39 muestra la posición de uno de estos planos de deslizamiento y una de estas direcciones de deslizamiento en una celda hexagonal unitaria. La característica significativa de este modo de deformación es que la dirección <-1-123> no es la dirección compacta en la estructura cristalina hexagonal. Antes de la observación del deslizamiento {11-22} <-1-123>, se había observado la dirección de deslizamiento en todos los metales como compacta, casi universalmente. Este corrimiento piramidal de segundo orden fue observado primero por Bell y Cahn en cristales macroscópicos de cinc, pero también fue verificado por Price tanto en cinc como en Cadmio, utilizando el microscopio de transmisión electrónica (TEM). La última técnica utiliza una probeta metálica en forma de una hoja delgada a cuyo a través pasa un haz electrónico del microscopio. En una probeta que contenga dislocaciones, el haz electrónico sufre efectos de difracción ocasionando que las dislocaciones aparezcan como sombras sobre la imagen de la probeta. El microscopio de transmisión electrónica hace posible en esta forma la observación directa de las dislocaciones. El trabajo de Price no sólo ha confirmado la existencia de esta clase de deslizamiento, sino que ha mostrado realmente las dislocaciones responsables del mismo. Corrimiento Fácil en Metales Hexagonales. Los metales cinc, cadmio, y magnesio son únicos que poseen tanto una baja tensión cizallante crítica como un plano de deslizamiento primario simple, el plano basal. Suponiendo que este plano de deslizamiento sea orientado en forma apropiada con respecto al eje de esfuerzo tensor, se pueden producir deformaciones de gran magnitud por deslizamiento basal. Los deslizamientos simultáneos sobre planos de deslizamiento primarios intersectantes no son un problema en estos metales con un plano de deslizamiento simple y la relación de endurecimiento por deformación es por tanto mucho menor que en los cristales cúbicos centrados en las caras. La región del corrimiento fácil en una curva de esfuerzo tensión-deformación, en lugar de extenderse ______________________________________________________________________ 108 P.D-S
únicamente en varios porcentajes, puede exceder valores del cien por ciento. De hecho, es bastante posible estirar un cristal de magnesio en forma de listón cuatro a seis veces su longitud original. La gran plasticidad de los cristales simples de estos tres metales hexagonales no se transporta a su forma policristalina. El magnesio, cinc, o cadmio policristalinos tiene baja ductilidad. En los párrafos anteriores se señaló que la gran ductilidad de los cristales simples se debe al hecho de que el deslizamiento ocurre sobre un plano cristalográfico simple. Sin embargo, en el material policristalino, la deformación plástica es mucho más complicada que en los cristales simples. Cada cristal debe experimentar una deformación que le permita conformarse a los cambios de forma de sus vecinos. Los cristales con sólo un plano de deslizamiento simple, no tienen el grado de plasticidad suficiente para deformaciones extensas bajo las condiciones que ocurren en los metales policristalinos. Cristales Cúbicos Centrados en el Cuerpo. Los cristales cúbicos centrados en el cuerpo se caracterizan por cuatro direcciones compactas, las direcciones <111>, y por la carencia de un verdadero plano compacto como el octaédrico de la red cúbica centrada en las caras, o por el plano basal de la red hexagonal. La Fig. 4.40 muestra un modelo de bola dura del plano (110) cúbico centrado en el cuerpo, el plano más compacto en esta red. En este plano hay dos direcciones compactas, la [-111] y la [1-11]. Una comparación de la Fig. 4.40 y la Fig. 4.33 (plano octaédrico cúbico de centrado en las caras) confirma el hecho de que los planos {110} cúbicos de centrado en el cuerpo no son planos de los más compactos.
Fig. 4.40 El plano (110) de la red cúbica centrada en el cuerpo. El fenómeno de deslizamiento observado en los cristales cúbicos de centrado en el cuerpo corresponde estrechamente con el esperado en cristales con direcciones compactas y sin planos verdaderamente compactos. La dirección de deslizamiento en los cristales cúbicos centrados en el cuerpo es la dirección compacta <111>; sin embargo, el plano de deslizamiento no está bien definido. Las líneas de deslizamiento en la red cúbica centrada en el cuerpo son sinuosas e irregulares, haciendo con frecuencia que la identificación de un plano de deslizamiento en los cristales cúbicos centrados en el cuerpo, pero trabajos recientes sobre cristales de hierro simples indican que cualquier plano que contenga la dirección <111> compacta actúa como un plano de deslizamiento. En concordancia con la falta de un plano compacto está la elevada tensión cizallante crítica para el deslizamiento en los metales cúbicos de centrado en el cuerpo. En el hierro es aproximadamente 4000 lb/plg2 (281 kg/cm2) a temperatura ambiente.
______________________________________________________________________ 109 P.D-S
5. Dislocaciones y límite de grano 5.1. Deslizamiento Transversal El deslizamiento transversal es un fenómeno que ocurre en cristales donde hay dos o más planos de deslizamiento con una dirección de deslizamiento común. Como ejemplo, tómese el metal hexagonal magnesio en el cual, a bajas temperaturas, puede ocurrir el deslizamiento sobre el plano basal o sobre planos prismáticos {10-10}. Estos dos tipos de planos tienen direcciones de deslizamiento comunes las direcciones <11-20> compactas. Las orientaciones relativas del plano basal y de un plano prismático se muestran en la Fig. 5.1A y 5.1B, donde se supone que cada diagrama representa un cristal en la misma orientación básica (el plano basal paralelo a las superficies superior e inferior). En el primer croquis, el cristal está cizallado sobre el plano basal, en tanto que en el segundo está cizallado sobre el plano prismático. La tercera ilustración, Fig. 5.1C, muestra la naturaleza del deslizamiento transversal. Aquí se observa que la superficie de deslizamiento real no es
Fig. 5.1 Representación esquemática de deslizamiento transversal en un metal hexagonal: (A) Deslizamiento sobre un plano basal; (B) Deslizamiento sobre el plano prismático, y (C) Deslizamiento sobre planos basal y prismático. un plano simple, sino que está formada de segmentos, parte de los cuales quedan en el plano basal y parte en el plano prismático. El perfil resultante de la superficie de deslizamiento tiene la apariencia de una escalera. Una analogía simple para deslizamiento transversal lo proporciona un cajón de un mueble. El deslizamiento de los lados y del fondo del cajón en relación con el marco del mueble es básicamente similar al movimiento cizallante que se efectúa en el deslizamiento transversal. En la Fig. 5.2 se muestra una fotografía de un cristal de magnesio mostrando deslizamiento transversal, donde el plano de la fotografía es equivalente a las fuerzas hacia las caras delanteras de los cristales esquemáticos mostrados en la Fig. 5.1. Obsérvese que mientras en esta probeta se produce el deslizamiento primordialmente a lo largo de un plano prismático, los segmentos de deslizamiento transversal sobre el plano basal son evidentes.
______________________________________________________________________ 110 P.D-S
Fig. 5.2 Deslizamiento transversal en magnesio. Las huellas del plano de deslizamiento vertical corresponden al plano prismático{1010}, mientras que las huellas del plano de deslizamiento horizontal Durante el deslizamiento transversal las dislocaciones que producen la deformación deben, desplazarse de un plano de deslizamiento al otro. En el ejemplo anterior, las dislocaciones se mueven desde el plano prismático al plano basal y de vuelta al plano prismático. El desplazamiento real de la dislocación desde un plano a otro sólo puede producirse por una dislocación en la orientación helicoidal. Las dislocaciones de borde, como se indicó al principio, tienen sus vectores de Burgers normales a sus líneas de dislocación. Como el plano de deslizamiento activo debe contener el vector de Burgers y a la línea de dislocación, las dislocaciones de borde están confinadas a moverse en un plano de deslizamiento simple. Las dislocaciones helicoidales, con sus vectores de Burgers paralelos a las líneas de dislocación, son capaces de moverse en cualquier plano que pase a través de la línea de dislocación. La manera en que una dislocación helicoidal puede producir un escalón en un plano de deslizamiento se muestra esquemáticamente en la Fig. 5.3. El hecho de que las componentes de borde y helicoidales de una dislocación pueden moverse, bajo una fuerza aplicada dada, con velocidades ampliamente distintas, tiene probablemente una relación importante sobre el deslizamiento transversal en los cristales.
______________________________________________________________________ 111 P.D-S
Fig. 5.3 Movimiento de una dislocación helicoidal durante el deslizamiento transversal. En la figura superior la dislocación se mueve en un plano vertical, mientras que en la figura inferior su plano de deslizamiento se ha corrido de manera que se mueva horizontalmente. Donde se han comparado experimentalmente las velocidades de los dos tipos de dislocaciones, se ha encontrado que las componentes de borde se mueven con velocidades más altas. Este hecho ha sido observado en el aluminio1, silicio2 y en el cristal iónico LiF3. En los cristales de fluoruro de litio, las componentes de borde tienen una velocidad aproximadamente cincuenta veces mayor que las componentes helicoidales. Las dislocaciones se forman en un cristal como pequeños anillos que contienen componentes tanto de borde como helicoidales. Si, en la mayor parte de los metales, se mantiene realmente una diferencia de velocidades del orden de la observada en el LiF, esto implicaría que un anillo de dislocación crece en un tiempo muy corto en que ascendería a un par de dislocaciones helicoidales paralelas. Claramente, tal configuración de dislocaciones conduciría al deslizamiento transversal. Sin embargo, es necesario indicar que el deslizamiento transversal se observa también en metales donde las dislocaciones se disocian en dislocaciones parciales. En este caso, el fenómeno de deslizamiento transversal es más complicado. Las dislocaciones parciales se discutirán posteriormente en este capítulo.
5.2. Bandas de deslizamiento Una banda de deslizamiento es un grupo de líneas de deslizamiento estrechamente espaciadas que tienen la apariencia, a baja amplificación, de ser una gran línea simple de deslizamiento. En muchos metales, las bandas de deslizamiento tienden a ser onduladas e irregulares en apariencia, lo cual evidencia que las dislocaciones que producen las bandas en estos metales no están confinados a moverse en un plano simple. El desplazamiento de 1
Chem, N.K., y Pond, R. B., Trans. AIME, 194 (1952), Pág. 1085. Low, J.R., y Guard, R. W., Acta Met. 3 Johnston, W. G., y Gilman, J. J., Jour. Appl. Phys., 30 (1959). Pág. 129. 2
______________________________________________________________________ 112 P.D-S
las dislocaciones desde un plano de deslizamiento a otro puede realizarse tanto por el ascenso de dislocaciones de borde como por deslizamiento transversal de dislocaciones helicoidales. De estas dos posibilidades, la última es probablemente la más importante. La resolución de las líneas de deslizamiento individuales es una banda de deslizamiento es normalmente una tarea que requiere el empleo de un microscopio electrónico. Sin embargo, cuando se observa una banda de deslizamiento sobre una superficie que es casi paralela al plano de deslizamiento activo, es algunas veces posible, cualitativamente al menos, resolver las componentes de una banda de deslizamiento con ayuda de un microscopio ligero.
5.3. Notación vectorial para dislocaciones Hasta aquí, nos hemos interesado en las dislocaciones sólo en un sentido general y, para ilustración, únicamente se ha considerado el tipo de estructura más elemental, una red cúbica simple. En un cristal real, debido a la disposición espacial más compleja de los átomos, las dislocaciones son complicadas y difíciles de visualizar. Algunas veces es conveniente dejar a un lado todas las consideraciones de la apariencia geométrica de una dislocación complicada y definir la dislocación por su vector de Burgers. Aquí es especialmente conveniente la notación vectorial para los vectores de Burgers. Se ha indicado ya que, en cualquier forma cristalina, la distancia entre átomos en una dirección compacta corresponde a la distancia cizallante más pequeña que preservará a la estructura del cristal durante un movimiento deslizante. Las dislocaciones con los vectores de Burgers iguales a este esfuerzo cizallante son energéticamente la más favorecidas en una estructura cristalina dada. En relación con la notación del vector, la dirección de un vector de Burgers puede representarse por los índices de Miller de su dirección, y la longitud del vector se puede expresar por medio de un factor numérico apropiado puesto enfrente de los índices de Miller. Es necesario considerar varios ejemplos explicativos.
Fig. 5.4 Espaciamiento entre los átomos en las direcciones compactas de diferentes sistemas cúbicos: centrado en las caras, cúbico centrado en el cuerpo, y cúbico simple. La Fig. 5.4 representa a la celda unitaria para estructuras cúbicas. En una red cúbica simple, la distancia entre átomos en una dirección compacta es igual a la longitud de un borde de la celda unitaria. Ahora consideremos el símbolo [100]. Esta cantidad puede ser tomada para ______________________________________________________________________ 113 P.D-S
representar un vector, tal como se muestra en la Fig. 5.4, con una componente unitaria en la dirección x, y es, por tanto, la distancia entre átomos en la dirección x. Una dislocación con un vector de Burgers paralelo a la dirección x en una red cúbica simple se representa por consiguiente por [100]. Ahora considérese una red cúbica centrada en las caras. Aquí la dirección compacta es una diagonal frontal y la distancia entre átomos en esta dirección es igual a la mitad de la longitud de la diagonal frontal. En la Fig. 5.4, la diagonal frontal indicada ob tiene índices[101]. Este símbolo corresponde también a un vector con componentes unitarias en las direcciones x y z y una componente cero en la dirección y. Como resultado, una dislocación en una red cúbica centrada en las caras que tenga un vector de Burgers quedando en la dirección [101] deberá escribirse ½ [101]. En la red cúbica centrada en el cuerpo, la dirección compacta es una diagonal cúbica, o una dirección de la forma<111>. La distancia entre átomos en estas direcciones es la mitad de la longitud de la diagonal, por lo que una dislocación que tenga un vector de Burgers paralelo a [111], por ejemplo, se escribe ½ [111].
5.4. Dislocaciones en la red cúbica centrada en las caras El plano de deslizamiento primario en la red cúbica centrada en las caras es el plano octaédrico {111}. La vista de la Fig. 5.5 es normal a un plano de este tipo y, cuando se mira hacia abajo sobre el plano extra de la dislocación, muestra una dislocación en la orientación de borde. Los círculos oscuros representan al plano compacto (111) en el cual termina el plano extra de la dislocación de borde, mientras que los círculos claros son los átomos en el plano compacto (111) próximo siguiente. Obsérvese que en el último plano falta una fila de átomos en zig-zag. Esto corresponde al plano de la dislocación de borde. Considérese ahora el plano de átomos(que queda directamente sobre la fila en zigzag de átomos claros) inmediatamente a la izquierda del plano faltante de átomos. El movimiento de los átomos de este plano a través de la distancia horizontal b desplaza a la dislocación una unidad a la izquierda. El vector b representa así al vector de Burgers de la dislocación, el cual se designa ½ [-110], de acuerdo con el método delineado en la sección precedente. Movimientos similares en sucesión de los planos de átomos que se encuentran a la izquierda de la dislocación ocasionarán que ésta se mueva a través de todo el cristal. Como es de esperar, este movimiento de dislocación cizalla la mitad superior del cristal (sobre el plano del papel) una unidad b a la derecha en relación con la mitad del fondo (por debajo del plano del papel). Una dislocación del tipo mostrado en la Fig. 5.5 no se mueve normalmente en la forma sencilla discutida en el párrafo anterior. Como puede deducirse con la ayuda de un modelo de bolas de ping-pong de la disposición de los átomos en la Fig. 5.5, el movimiento de un plano de átomos en zig-zag, tal como aa, a través de la distancia horizontal b implicaría una deformación muy grande de la red, debido a que cada átomo claro en el plano de deslizamiento sería forzado a ascender sobre el átomo oscuro debajo del mismo y a su derecha. Lo que se cree que sucede realmente es que el plano indicado de átomos hace el movimiento indicado por los vectores marcados c en la Fig. 5.6. Este movimiento puede ocurrir con una deformación mucho más pequeña de la red. Un segundo movimiento del mismo tipo, indicado por los vectores marcados d, lleva a los átomos a las mismas posiciones finales que el desplazamiento simple b de la Fig. 5.5.
______________________________________________________________________ 114 P.D-S
Fig. 5.5 Una dislocación total (orientación de borde) en una red cúbica centrada en las caras, vista se mira hacia abajo sobre el plano de deslizamiento.
Fig. 5.6 Dislocación parcial en una red cúbica centrada en las caras. La disposición atómica de la Fig. 5.6 es particularmente significativa debido a que muestra cómo una dislocación de unidad simple puede abatirse en un par de dislocaciones parciales. En esta forma, la aislada fila de átomos simples en zig-zag tiene una dislocación incompleta en cada uno de sus lados. Los vectores de Burgers de estas dislocaciones son los vectores c y d mostrados en la figura. La notación vectorial para estos vectores de Burgers puede ser deducida con la ayuda de la Fig. 5.7. Esta figura muestra la superficie (111) de un cristal cúbico centrado en las caras en relación a la celda unitaria de la estructura. Las posiciones de los átomos en esta superficie están indicadas por círculos dibujados con trazos cortos. Los lugares que serían ocupados por los átomos en el plano próximo superior están designados por círculos pequeños con la letra B en su interior. En el centro de la Fig. 5.7 hay otro círculo pequeño marcado con la letra C. El vector de Burgers de la dislocación
______________________________________________________________________ 115 P.D-S
total es igual a la distancia B1B2, mientras que los vectores de Burgers de las dos dislocaciones parciales c y d de la fig. 5.6 son los mismos que las distancias B1C y CB2. El
Fig. 5.7 La relación de la orientación entre los vectores de Burgers de una dislocación total y sus dislocaciones parciales. vector de Burgers de la dislocación total es ½ [-110], lo cual se deduce de la discusión previa. La línea B1C queda en la dirección [-12-1]. El símbolo [-12-1] reprsenta a un vector con componentes negativas unitarias en las direcciones x y z y una componente de 2 en la dirección y. Este es un vector cuya longitud es dos veces la distancia mn en la Fig. 5.7. Como B1C es justamente un tercio de la línea mn, el vector de Burgers para esta dislocación es 1/6 [-12-1]. En la misma manera, puede mostrarse que el vector CB2 puede ser representado por 1/6[-211]. La dislocación total cúbica centrada en las caras ½ [-110] es capaz de disociarse en dos dislocaciones parciales de acuerdo con la notación.
[ ] [ ] [ ]
1 1 1 110 = 121 + 211 2 6 6
Cuando una dislocación total se convierte en un par de dislocaciones parciales, disminuye la energía de deformación de la red. Esto resulta porque la energía de una dislocación es proporcional al cuadrado de su vector de Burgers y debido a que el cuadrado del vector de Burgers de la dislocación total es más de dos veces mayor que el cuadrado del vector de Burgers de una dislocación parcial. Debido a que las dislocaciones parciales de la Fig. 5.6 representan aproximadamente iguales deformaciones de la red, existe una fuerza repulsiva
______________________________________________________________________ 116 P.D-S
Fig. 5.8 Una dislocación extendida. entre ellas que las fuerza a separarse. Tal separación añadirá planos adicionales de átomos al plano simple en zig-zag de la Fig. 5.6, como se muestra en la Fig. 5.8. Una dislocación total que se ha disociado en un par de parciales separadas como las de la última figura se conoce como una dislocación extendida. Un hecho importante de observar sobre la Fig. 5.8 es que los átomos claros que quedan entre las dos dislocaciones parciales tienen disposiciones apiladas que se diferencian de las de los átomos sobre el lado alejado de cualquiera de las dislocaciones parciales. En esta forma, si suponemos que los átomos oscuros ocupan las posiciones A en una secuencia apilada y los átomos claros en cualquier extremo de la figura, posiciones B, entonces los átomos claros entre las dos dislocaciones parciales quedan sobre las posiciones C. En esta región, la secuencia de apilamiento normal ABCABC... de la red cúbica centrada en las caras sufre discontinuidad y se vuelve ACABCA... Las flechas indican las discontinuidad. Las discontinuidades en el orden de apilamiento de los planos {111}, o compactos, se llaman fallas de apilamiento. En el presente ejemplo, la falla de apilamiento se produce sobre el plano de deslizamiento (entre los átomos claros y oscuros) y está confinada en sus extremos por dislocaciones parciales de Shockley. En la red cúbica centrada en las caras4las fallas de apilamiento pueden presentarse en cierto número de formas distintas. En todos los casos, si una falla de apilamiento termina dentro de un cristal sus límites formarán una dislocación parcial. Las dislocaciones parciales de fallas de apilamiento, en general, pueden ser bien del tipo Shockley, con el vector de Burgers de la dislocación quedando en el plano de la falla, o del tipo de Frank, con el vector de Burgers normal a la falla de apilamiento. Las dislocaciones parciales que se están considerando ahora, sin embargo, son únicamente las asociadas con el desplazamiento y son de la forma Shockley. Como los átomos sobre cualquiera de los lados de una falla de apilamiento no están en las posiciones que ocuparían normalmente en una red perfecta, una falla de apilamiento posee una energía de superficie que, generalmente, es pequeña comparada con la de un límite de grano ordinario, pero no obstante finita. Esta energía de la falla de apilamiento juega una parte importante para determinar el tamaño de una dislocación extendida. Cuanto mayor sea la separación entre las dislocaciones parciales, menor será la fuerza repulsiva entre 4
Read, W. T., Dislocations in Crystals. McGraw-Hill Book Co., Inc., New York, 1953.
______________________________________________________________________ 117 P.D-S
ellas. Por otra parte, la energía de superficie total asociada con la falla de apilamiento aumenta con la distancia entre dislocaciones parciales. La separación entre las dos parciales representa en esta forma un equilibrio entre la energía repulsiva de las dislocaciones y la energía de superficie de la falla. Seeger5 y Schoeck6 han mostrado que la separación de un par de dislocaciones parciales en una dislocación extendida depende de un parámetro sin dimensión determinada σc/Gb2 , en donde σ es la energía de superficie de la falla de apilamiento, G es el módulo cizallante en el plano de deslizamiento, c es la separación entre planos de deslizamiento contiguos, y b es la magnitud del vector de Burgers. En ciertos metales cúbicos de centrado en las caras representadas por el aluminio, este parámetro es mayor de 10-2 y la separación entre dislocaciones es sólo del orden de una simple distancia atómica. Se dice que estos metales poseen energías elevadas de falla de apilamiento. Cuando el parámetro es menor de 10-2, se dice que el metal tiene energía de falla de apilamiento baja. El cobre es un ejemplo representativo de un metal con baja energía de falla de apilamiento. La separación calculada de las dislocaciones parciales en el cobre es del orden de doce espaciamientos interatómicos si las dislocaciones extendidas están en la orientación de borde, y de unos cinco espaciamientos interatómicos si se encuentran en la orientación helicoidal. Debe decirse algo sobre el movimiento de una dislocación extendida a través de un cristal. El movimiento real puede ser bastante complicado por varias razones. Primero, si la dislocación en movimiento encuentra obstáculos, tales como otras dislocaciones o incluso partículas de segundo orden, variará la anchura de a falla de apilamiento. Segundo, las vibraciones térmicas pueden ocasionar también que la anchura de la dislocación de apilamiento varíe localmente a lo largo de la dislocación, siendo la variación una función del tiempo. En el caso en que se puedan desestimar éstos y otros efectos complicadores, una dislocación extendida puede describirse como un par de dislocaciones parciales, separadas por una distancia finita, que se mueven conjuntamente a través del cristal. La primera dislocación parcial, según se mueve, ocasiona cambios en el orden de apilamiento, en tanto que la segunda restaura el orden a su propia secuencia. Después de que ambas parciales han pasado un punto dado en la red, el cristal habrá sido cizallado (en el plano de deslizamiento) por una cantidad igual al vector de Burgers b de la dislocación total.
5.5. Dislocaciones extendidas en metales hexagonales Debido a que el plano basal de un metal hexagonal tiene exactamente la misma disposición compacta de átomos que el plano octaédrico {111} de los metales cúbicos de centrado en las caras, las dislocaciones extendidas pueden ocurrir también en éstos metales. En el sistema hexagonal, la dislocación de un dislocación total en un par de parciales sobre el plano basal se expresa en la siguiente forma:
[ ] [ ] [ ]
1 1 1 1210 = 0110 + 1100 3 3 3
la ecuación anterior representa exactamente la misma adición de vectores de Burgers que la dada en la sección previa para el sistema cúbico centrado en las caras, esto es,
5 6
Seeger, A.,y Schoeck, G., Acta Met., 1 (1953), Pág. 519. Seeger, A., Dislocations and Mechanical Properties of Crystals. Jhon Wiley & Sons, Inc., New York, 1957.
______________________________________________________________________ 118 P.D-S
[ ] [ ] [ ]
1 1 1 110 = 121 + 211 2 6 6
La única diferencia entre las dos ecuaciones descansa en el uso actual de los índices de Miller de cuatro dígitos para metales hexagonales. La falla de apilamiento asociada con las dislocaciones extendidas en los metales hexagonales es similar a la de los metales de centrado en las caras. El movimiento de la primera dislocación parcial a través del cristal cambia la secuencia de apilamiento ABABABAB... a ACBCBCBC... en el caso de que el segundo plano se deslice en relación con el primero. Obsérvese que la secuencia CBCBCB.. es una perfectamente buena secuencia hexagonal con planos alternados que quedan unos sobre otros. La falla de apilamiento ocurre entre los dos primeros planos; entre AC... como en el ejemplo cúbico de centrado en las caras, el movimiento de la segunda dislocación parcial restaura al cristal a la secuencia de apilamiento apropiada ABABAB...
5.6. Dislocaciones extendidas y deslizamiento transversal Bajo circunstancias normales, no se espera que una dislocación parcial sea capaz de cambiar su plano de deslizamiento. En otras palabras, cuando una dislocación toma la forma de una dislocación extendida es confinada a moverse únicamente en el plano basal en un metal hexagonal, o en su plano octaédrico específico en un metal cúbico de centrado en las caras. En consecuencia, en tanto exista una dislocación en una forma extendida, no puede tomar parte en el deslizamiento transversal. Para que ocurra el deslizamiento transversal, deben recombinarse las dislocaciones parciales para formar una dislocación total. Como el deslizamiento transversal está asociado únicamente con la componente helicoidal de una dislocación, la dislocación recombinada total debe estar en una orientación helicoidal. Generalmente se cree que la facilidad con la que ocurra el deslizamiento transversal en los metales hexagonales y cúbicos de centrado en las caras es un resultado de la facilidad de derrumbamiento de las dislocaciones parciales a dislocaciones totales. Esto debería ser más fácil en un metal con elevada energía de falla de apilamiento, tal como el aluminio, donde hay muy poca separación entre las dislocaciones parciales, y más difícil en un metal, tal como el cobre, en el cual es mayor la anchura de la falla de apilamiento.
5.7. Intersecciones de dislocaciones Las dislocaciones en un metal constituyen una red tridimensional de fallas lineales. En relación con cualquier plano de deslizamiento dado, habrá cierto número de dislocaciones que queden en este plano y sean capaces de producir deslizamiento a lo largo del mismo. Al mismo tiempo, habrá muchas otras dislocaciones que lo intersecten en diversos ángulos. En consecuencia, cuando se mueva una dislocación debe, necesariamente, pasar a través de aquellas dislocaciones que intersecten a su plano de deslizamiento. El corte de las dislocaciones por otras dislocaciones es un asunto importante porque, en general, se requiere trabajo para hacer las intersecciones. La facilidad o dificultad relativa con lo que ocurra el deslizamiento es determinada en parte por la intersección de dislocaciones. Para un ejemplo sencillo del resultado de una intersección de dislocación, véase la Fig. 5.9. En el dibujo dado se supone que una dislocación se ha movido a través del plano de deslizamiento ABCD cizallando con ello la mitad superior del cristal rectangular relativo a la mitad inferior por la longitud de su vector de Burgers b. En la Fig. 5.9 se muestra una ______________________________________________________________________ 119 P.D-S
segunda dislocación (vertical), teniendo un anillo que intersecta al plano de deslizamiento en dos puntos. Por conveniencia, se supone que este anillo se encuentra en la orientación de borde donde intersecta al plano de deslizamiento. El desplazamiento indicado del cristal, que se muestra en la Fig. 5.9, cizalla también la mitad superior del anillo de dislocación vertical relativo a su mitad del fondo en la cantidad del vector de Burgers b. Esta acción cizallante no puede romper al anillo en dos medios anillos separados porque, de acuerdo
Fig. 5.9 En la figura se supone que una dislocación de borde se ha movido a través del plano horizontal ABCD y, al cortar a través del anillo de dislocación vertical, forma un par de escalones en el último. con la regla, una dislocación no puede terminar en el interior de un cristal. La única alternativa es que el desplazamiento prolongue al anillo de dislocación vertical por una cantidad igual a los dos escalones horizontales mostrados en la Fig. 5.9. Este resultado es característico de la intersección de dislocaciones, pues si una dislocación corta a otra, una o ambas dislocaciones pueden adquirir escalones. Consideremos ahora algunos de los tipos de escalones más sencillos∗ que se forman por intersecciones de dislocaciones. Los dos casos más definidos son, primero, cuando el escalón queda en el plano de deslizamiento de una dislocación y, segundo, cuando el escalón es normal al plano de deslizamiento de una dislocación. El primer caso se trata en la Fig. 5.10. Aquí, el dibujo de la izquierda representa una dislocación en la orientación de borde, y el de la derecha una dislocación en la orientación helicoidal, en ambas se han formado escalones (on) como resultado de intersecciones con otras dislocaciones. Debe observarse que el escalón en la dislocación de borde tiene una orientación helicoidal. (Vector de Burgers paralelo a la línea on), mientras que el escalón en la dislocación helicoidal tiene una orientación de borde (Vector de Burgers normal a la línea on). Ambos de estos escalones son inestables, y pueden ser eliminados fácilmente, por ejemplo moviendo la línea mn sobre la posición de la línea de trazos. Este movimiento, en ambos casos, puede ocurrir por deslizamiento simple. Como la eliminación de un escalón disminuye la energía del cristal en la cantidad de la energía de deformación asociada con un ∗
“Jogs” en inglés.
______________________________________________________________________ 120 P.D-S
escalón, puede suponerse que los escalones de este tipo tenderán a desaparecer. Como los escalones que quedan en el plano de deslizamiento son fácilmente removidos por ambas orientaciones primarias (de borde y helicoidal) de una dislocación, puede concluirse que no tienen importancia relativamente.
Fig. 5.10 Dislocaciones con escalones que quedan en el plano de deslizamiento de las dislocaciones.
Fig. 5.11 Dislocaciones con escalones normales a sus planos de deslizamiento. Una dislocación de borde y una helicoidal, con escalones normales al plano de deslizamiento primario se muestran en las Figs. 5.11A y 5.11B. Debe observarse que el escalón de la Fig. 5.11B es capaz también de eliminación si se puede mover la dislocación en un plano normal al plano de deslizamiento indicado, esto es, en un plano vertical. Esto se deduce del hecho de que si se mira a esta dislocación escalonada como si quedase en un plano vertical, entonces tendremos la misma disposición que la mostrada en la Fig. 5.10B. Sin embargo, supongamos que ambas dislocaciones de la Fig. 5.11 no son capaces de corrimiento en un plano vertical. ¿Cuál es entonces el efecto de los escalones sobre el movimiento de las dislocaciones en sus superficies de deslizamiento horizontal?. A este respecto, es evidente que la dislocación de borde con un escalón, mostrada en la Fig. 5.11B, es libre de moverse sobre la superficie escalonada mostrada en la figura, los tres segmentos de la dislocación, mn, no y op, están en una orientación de borde simple con sus vectores de Burgers respectivos quedando en los planos del cristal que contienen los segmentos de dislocación. La única diferencia entre el movimiento de esta dislocación y una dislocación ______________________________________________________________________ 121 P.D-S
de borde ordinaria es que en lugar de correrse a lo largo de un plano simple se mueve sobre una superficie escalonada. La dislocación helicoidal con un escalón, mostrada en la Fig. 5.11B, representa un caso enteramente distinto. Aquí, el escalón es una dislocación de borde con un plano incompleto que queda en la superficie escalonada. Como argumento, supongamos que su plano extra queda a la izquierda de la línea no y en esa forma corresponde al área sombreada en la Fig. 5.11B. Ahora hay dos medios básicos de que pueda formarse un plano incompleto que es sólo un espaciamiento atómico de altura. En el primer caso, puede suponerse que el área sombreada corresponde a una fila de átomos intersticiales que terminan en no. Como alternativa, se puede considerar al escalón sombreado como una parte del plano reticular continuo normal, y entonces, la superficie escalonada a la derecha de no tendría que ser una fila de lugares desocupados o vacantes. El último caso es el indicado en el dibujo de la Fig. 5.11B. La presentación de cualquiera de estas dos alternativas depende de la orientación relativa de los vectores de Burgers de las dos dislocaciones, cuya intersección causó el escalón. A este respecto, debe mencionarse que estos escalones se forman cuando una dislocación helicoidal intersecta a otra dislocación helicoidal. Los otros escalones ilustrados en la Fig. 5.10 y 5.11A están formados por varias intersecciones que implican dislocaciones de borde con otros bordes, o dislocaciones de borde con helicoidales. Read7 discute en detalle estas posibilidades diferentes y muestra en particular la forma en que la intersección de dos dislocaciones helicoidales puede conducir a la producción, bien de una fila de lugares vacantes o una fila de átomos intersticiales. En relación con estas filas de lugares vacantes, o átomos intersticiales, debe indicarse que después que una dislocación helicoidal ha intersectado a otra, la fila de defectos de punto (lugares vacantes o átomos intersticiales) se alarga en una línea desde la dislocación en movimiento retrocediendo a la estacionaria. Esto es, por supuesto, en la suposición de que la energía térmica no cause que los defectos de punto se difundan dentro de la retícula. En términos de la Fig. 5.11B, esto significa que si la dislocación indicada se mueve a la izquierda, la fila de lugares vacantes a su derecha se extenderá retrocediendo a otra dislocación helicoidal, cuya intersección por la dislocación en movimiento ocasionó la formación de la fila de lugares vacantes. Mientras que la dislocación de borde con un escalón normal a su plano de deslizamiento es capaz de moverse por corrimiento simple a lo largo de la superficie escalonada de la Fig. 5.11A, éste no será el caso de la dislocación helicoidal escalonada de la Fig. 5.11B. Aquí, el escalón (línea no), que está en una orientación de borde, no es capaz de correrse a lo largo de la superficie vertical mostrada en la figura, debido a que su vector de Burgers no se encuentra en la superficie del escalón sino normal al mismo. El único medio de que se pueda mover el escalón a través de la superficie del paso es por la ascensión de la dislocación. En esta forma, en la Fig. 5.11B, si el escalón se mueve hacia la izquierda con el resto de la dislocación, se tendrán que añadir lugares vacantes adicionales a la fila de lugares vacantes (a la derecha de la línea no). Como alternativa, si el plano extra ha sido formado por una fila de átomos intersticiales a la izquierda del escalón, el movimiento de éste (en este caso hacia la derecha) requiere la creación de átomos intersticiales adicionales. En cualquier caso, previsto que no se puedan eliminar los escalones fácilmente, la intersección de dislocaciones helicoidales con otras helicoidales puede conducir a la
7
Read, W. T., Jr., Dislocations in Crystals, McGraw.Hill Book Company, Inc., New York, 1953.
______________________________________________________________________ 122 P.D-S
formación de filas de lugares vacantes, o de átomos intersticiales, cuando se ocasiona el movimiento de las dislocaciones. Resumiendo el asunto de los escalones, se ve que los importantes son los que se forman normales al plano de deslizamiento de la dislocación, Read8 ha dado una regla general para la formación de este tipo de escalones: “Cuando un dislocación corta a otra, cada dislocación adquiere un escalón igual a la componente normal a su propio plano de deslizamiento del vector de Burgers de la otra dislocación”. La formación de un escalón en una dislocación aumenta la longitud de ésta y en consecuencia su energía. Esta energía debe ser suministrada por la fuerza que mueve a la dislocación. En esta forma, parte del trabajo de deformación se involucra en el corte de las dislocaciones por otras dislocaciones. Además, las dislocaciones con escalones normales a sus planos de deslizamiento requieren una fuerza adicional para moverlas, debido al arrastre ofrecido por los escalones que deben ser atraídos junto con el resto de la dislocación. Un punto interesante a este respecto es el siguiente: debe esperarse que los escalones en las dislocaciones helicoidales (Fig. 5.11B) ofrecerán una mayor resistencia al arrastre que los escalones correspondientes a las dislocaciones de borde (Fig. 5.11A). Esto puede contar con el hecho observado experimentalmente de que las dislocaciones helicoidales tienden a moverse con mayor lentitud a través de un cristal que las dislocaciones de borde. (Ver sección sobre Deslizamiento Transversal)
5.8. Límite de grano Sólo se ha estudiado primordialmente las propiedades de los metales muy puros en la forma de cristales simples. El estudio de los cristales simples es importante porque conduce a un entendimiento más rápido de muchos problemas básicos. Sin embargo, los cristales simples son esencialmente una herramienta de laboratorio y raramente se hallan en objetos de metal comerciales los cuales, como una regla, consisten de muchos miles de pequeños cristales metálicos microscópicos. La Fig. 5.12 muestra la estructura cristalina de una probeta policristalina (muchos cristales) típica, amplificada 500 veces. El diámetro promedio de los cristales es muy pequeño, 0.05mm aproximadamente, y cada cristal se ve que está separado de sus vecinos por líneas oscuras, los límites de grano. Los límites de grano parecen tener una anchura apreciable, pero esto es únicamente debido a que la superficie ha sido atacada con una solución ácida para poder revelar su presencia. Una probeta policristalina sumamente pulida de un metal puro que no haya sido atacado aparecerá enteramente “blanca” bajo el microscopio, esto es, no mostrará límites de grano. La anchura de un límite de grano es, por tanto, muy pequeña. Los límites de grano juegan un papel importante en la determinación de las propiedades de un metal. Por ejemplo, a bajas temperaturas los límites de grano son, como regla, bastantes fuertes y no debilitan a los metales. De hecho, los metales puros muy deformados, y la mayoría de las aleaciones, fallan a bajas temperaturas por fisuras que pasan a través de los cristales y no de los límites de grano. Las fracturas de este tipo se llaman transcristalinas. Sin embargo, a temperaturas elevadas y a proporciones de deformación bajas, los límites de grano pierden su resistencia con mayor rapidez que lo hacen los cristales, resultando que las fracturas no atraviesan ya a los cristales sino que corren a lo largo de los límites de grano. Las fracturas de este último tipo se denominan intercristalinas. En los siguientes párrafos se cubrirán cierto número de otros aspectos importantes sobre límites de grano. 8
Read, w. T., Jr., Dislocations in Crystals, McGraw-Hill Book Company, Inc., New York, 1953.
______________________________________________________________________ 123 P.D-S
Fig. 5.12 Una probeta policristalina de zirconio fotografiada con luz polarizada. En esta fotografía, pueden distinguirse los cristales individuales por la diferencia en el sombreado, así como por las delgadas líneas oscuras que representan los límites de grano.
5.9. Modelo de dislocaciones de un límite de grano de ángulo pequeño En 1940, tanto Bragg como Burgers introdujeron la idea de que los límites entre cristales de la misma estructura pueden ser considerados como conjunto de dislocaciones. Si dos granos difieren sólo ligeramente en su orientación relativa, es posible trazar sin dificultad un modelo de dislocación del límite. La Fig. 5.13 muestra un ejemplo de tal límite elemental en una red cúbica simple en la cual el cristal de la derecha es girado con respecto al de la izquierda alrededor de la dirección [100] (la dirección perpendicular al plano del papel). La línea vertical entre los puntos a y b corresponde al límite. Se ve que la red en ambos lados del límite está inclinada en la parte inferior hacia el límite, resultando que ciertos planos reticulares verticales cercanos de ambos cristales terminan en el límite como dislocaciones de borde positivas. Cuanto mayor sea la rotación angular de un cristal en relación con el otro, más grande es la inclinación de los planos que terminan como dislocaciones en el límite, y más cercano es el espaciamiento de las dislocaciones en el límite vertical. El espaciamiento de dislocación en el límite determina así la inclinación angular entre las retículas.
______________________________________________________________________ 124 P.D-S
Fig. 5.13 Modelo de dislocación de un límite de ángulo pequeño. Se a obtenido evidencia experimental de los límites de ángulo pequeño mediante el empleo de reactivos de ataque apropiados que atacan localmente la superficie de los metales en posiciones donde las dislocaciones cortan a la superficie. Después del ataque con uno de estos reactivos, los límites de ángulo pequeño, consistentes en filas de dislocaciones de borde, aparecen como filas de picaduras de ataque bien definidas. De acuerdo con la discusión en el párrafo precedente, la separación de estas picaduras de ataque químico (dislocaciones) deberá determinar la rotación angular de la red sobre un lado del límite en relación con el del otro. El hecho de que determinaciones sobre difracción de rayos X de la misma rotación reticular estén en buen acuerdo con el valor predicho por el espaciamiento de las dislocaciones, sirve como una excelente comprobación de la validez del modelo de dislocación para límites de ángulo pequeño. La Fig. 5.14 muestra una fotografía real de los límites de ángulo pequeño en un cristal de magnesio. El límite de grano representado en la Fig. 5.13 es un límite muy especial en el que se consideraba a las dos redes giradas sólo ligeramente con respecto a la opuesta alrededor de una dirección reticular común (un borde cúbico [100]). Esto, por supuesto, no representa el caso general de un límite de grano. Límites de grano más complicados, con ángulos grandes desajustados, deben involucrar disposiciones muy complicadas de dislocaciones y no ha sido preparado todavía cuadro simple alguno de su estructura. La dificultad principal para presentar un modelo de dislocación apropiado de un límite de ángulo grande descansa en el hecho de que el ángulo de desajuste entre los granos se vuelve más grande, las dislocaciones Deben juntarse más y, al hacerlo, tienden a perder su identidad.
______________________________________________________________________ 125 P.D-S
Fig. 5.14 Límites de ángulo pequeño en una probeta de magnesio. Las filas de picaduras de ataque químico corresponde n a posiciones donde las dislocaciones intersectan a la superficie.
5.10.
Energía de límite de grano
Una dislocación en un cristal representa un defecto lineal en la estructura cristalina, con átomos adyacentes a las dislocaciones empujadas o atraídos fuera de sus posiciones reticulares normales. Este desplazamiento de gran número de átomos desde posiciones que ocuparían normalmente en un cristal perfecto requiere un aumento en la energía del cristal. En consecuencia, con cada dislocación está asociada la energía de deformación. Si hay energía asociada con cada dislocación, debe haber también energía asociada con un conjunto de dislocaciones que forman un límite entre los dos cristales. Debido a la inherente naturaleza bidimensional de un límite de grano, esta energía se expresa mejor como energía por unidad de área (ergios/cm2). Read y Shockley han utilizado una teoría elástica para derivara una expresión teórica para la energía de límite de grano de un límite de ángulo pequeño como una función del ángulo de desajuste entre cristales adyacentes. El hecho de que su ecuación está en excelente acuerdo con los datos experimentales se muestra en la Fig. 5.15. La línea sólida de la figura representa la ecuación de ShockleyRead, en tanto que los datos en puntos son valores experimentales. Figura 5.15 La ecuación derivada sobre suposiciones válidas únicamente para ángulos que varíen menos de varios grados está en acuerdo notable con datos experimentales sobre ángulos tan elevados como de 20º. El hecho de que los datos teóricos y los experimentales concuerden tan bien en este amplio rango puede ser fortuito, pero no debe desestimarse el hecho de que el modelo de dislocación para límites de ángulo pequeño ha sido utilizado con éxito para predecir la dependencia de la energía del límite sobre el ángulo de desajuste. Esta es otra excelente confirmación para la suposición de que los límites de ángulo pequeño son deformaciones de dislocaciones.
______________________________________________________________________ 126 P.D-S
5.11.
Tensión superficial del límite de grano
La energía superficial de un límite de grano tiene las unidades de ergios/cm2. Esto es,
σ =
ergios cm 2
lo que equivale a
σ=
dinas·cm dinas = cm 2 cm
pero las unidades dinas/cm son las de tensión superficial. Los límites de grano sólidos poseen así una tensión superficial equivalente a la de superficies de líquidos. La tensión superficial de los límites de los cristales es un fenómeno metalúrgico importante. Los datos experimentales de la Fig. 5.15 muestran que la tensión superficial de límite de grano es una función ascendente del ángulo de desajuste entre granos a un ángulo de 20º, aproximadamente, y entonces es esencialmente constante para todos los ángulos mayores. Es difícil determinar valores absolutos o numéricos de la tensión superficial de las superficies metálicas. Sin embargo, se han hecho mediciones sobre cobre, plata y oro que muestran que sus tensiones superficiales de superficies libres (superficies exteriores) son del orden de 1200 a 1800 dinas/cm. Las superficies metálicas exteriores, en consecuencia, poseen tensiones relativamente grandes; éstas son aproximadamente 20 veces mayores que la del agua en estado líquido. Se ha determinado posteriormente que las tensiones superficiales de límites de grano de ángulo grande igualan aproximadamente a un tercio de los valores de las superficies libres, y por tanto son del orden de 300 a 500 dinas/cm. Mientras que los valores absolutos de la tensión superficial de los límites de grano son difíciles de medir, se pueden estimar los valores relativos de la energía superficial del límite con la ayuda de una relación simple. En la Fig. 5.16, representamos los límites de grano por tres líneas que quedan perpendiculares al plano del papel y se encuentran en una línea de proyección representada por o. Los tres vectores σα , σβ y σγ originados en el punto o representan, por sus direcciones y magnitudes, las tensiones superficiales de los tres límites. Si se supone que estos tres vectores de fuerza se encuentran en equilibrio estático, entonces debe ser cierta la relación siguiente:
σβ σγ σα = = senα senβ senγ
en donde α, β y γ son los ángulos diédricos entre límites. Como los límites de los cristales son regiones de desajuste o desorden entre los cristales, debe esperarse que ocurran con bastante facilidad movimientos atómicos a través y a lo largo de los límites. Se ocasiona el movimiento del límite por el simple proceso por el cual los átomos dejan un cristal y se unen a otro cristal sobre el otro lado del límite. Los límites de los cristales en los metales sólidos pueden moverse y no se debe pensar que están fijos en el espacio. La velocidad a que se mueven los límites cristalinos depende de cierto números de factores. El primero de éstos es la temperatura, puesto que la energía que hace posible que un átomo se mueva desde una posición de límite de grano en equilibrio a otra viene de vibraciones
______________________________________________________________________ 127 P.D-S
Fig. 5.15 Energía relativa de límite de grano como función del ángulo de desajuste entre los cristales que bordean al límite. La línea sólida representa la curva teórica; los puntos, a los datos experimentales de Dunn para hierro-silicio. térmicas. Por tanto, tenemos una situación análoga a la de los movimientos atómicos al interior de los cristales donde los átomos se difunden dentro de los lugares vacantes en la red como resultados de saltos activados térmicamente. El grado de movimiento debe aumentar rápidamente con la elevación de la temperatura. Sin embargo, siendo iguales otras cosas, debe esperarse que el mismo número de átomos cruce al límite en una dirección y en la opuesta, y que el límite esté relativamente fijo en el espacio. Realmente, los movimientos de los límites de grano ocurren únicamente si la energía del metal en conjunto desciende por un movimiento de átomos de mayor en una dirección que en la otra. Una manera de que se pueda bajar la energía de una probeta por el movimiento de un límite de grano ocurre cuando éste se mueve dentro de un cristal deformado, dejando detrás un cristal libre de deformación. Otra fuerza impulsora del movimiento se encuentra en la energía de los límites mismos. Un metal puede acercarse a un estado más estable reduciendo su área de límites de grano. Hay dos formas en que se puede lograr esto. Primero, los límites pueden moverse de manera que, enderecen regiones demasiados curvadas, y segundo, se pueden mover en tal forma que ocasionen la desaparición de algunos cristales, en tanto que otros crezcan de tamaño. El último fenómeno, que resulta en una disminución en el número total de granos, se denomina crecimiento de grano. Una de las consecuencias del movimiento de los límites de grano es que si un metal es calentado a una temperatura suficientemente elevada por un tiempo bastante largo, puede observarse realmente la relación de equilibrio entre las tensiones superficiales y los ángulos diédricos. En los metales puros con cristales orientados al azar, se presentan con poca frecuencia los límites de ángulo bajo, y puede suponerse que la energía de los límites de grano es constante para todos los límites. (Véase la Fig. 5.15). Si las energías superficiales (tensión superficial) son iguales en cada uno de los tres límites que se encuentran en una línea común, y si los límites han obtenido una configuración de equilibrio, los tres ángulos diedros deben ser iguales. Un examen de las uniones donde se encuentran los límites en la fotografía, Fig. 5.12, muestra un gran número de ángulos diedros de 120º. Este hecho es sorprendente cuando se considera que muchos de los límites de grano no son normales al plano de la fotografía. De hecho, si fuese posible cortar la superficie para que todos los límites fuesen perpendiculares a la superficie, se observaría una buena concordancia entre ______________________________________________________________________ 128 P.D-S
los ángulos experimentales y los predichos. Puede concluirse que en un metal bien recocido, esto es, que haya sido calentado durante un largo tiempo a una temperatura elevada, las intersecciones de los límites de grano forman ángulos muy cercanos a 120º.
Fig. 5.16 Tensiones superficiales de límites de grano en la unión de tres cristales.
5.12.
Límites entre cristales de fases diferentes
Un fase se define como un cuerpo homogéneo de materia que es físicamente distinto. Los tres estados de la materia (líquido, sólido y gaseoso) corresponden todos a fases separadas. En esta forma, un metal puro, por ejemplo, cobre, puede existir en fase sólida, líquida, o gaseosa, cada una estable en un rango de temperatura diferente. A este respecto, parecería que no hay diferencia entre los conceptos de fase y estado. Sin embargo, cierto número de metales son alotrópicos (polimorfos), esto es, pueden existir en diferentes estructuras cristalinas, cada una de ellas estable en un rango de temperatura diferente. Cada estructura cristalina en estos metales corresponde a una fase separada, y los metales alotrópicos, por tanto, poseen más de tres fases posibles. Cuando se combinan metales puros para formar aleaciones, pueden resultar estructuras cristalinas adicionales en cierta composición y rangos de temperatura. Cada una de estas estructuras cristalinas en sí constituye una fase separada. Finalmente, debe indicarse que una solución sólida (un cristal conteniendo dos o más tipos de átomos en la misma red) satisface también la definición de una fase. Un buen ejemplo de una solución sólida ocurre cuando se funden juntos cobre y níquel y después se les deja enfriar lentamente al estado sólido. Los cristales que se forman contienen átomos de níquel y de cobre en la misma proporción que la de la mezcla líquida original; ambos tipos de átomos ocupan indiscriminadamente los sitios reticulares del cristal. Por este momento, se ha introducido el concepto de fases para explicar los fenómenos adicionales de la tensión superficial. El estudio de las fases de los sistemas de aleación es un tópico que será considerado en un capítulo posterior. Los límites de grano de las aleaciones conteniendo cristales de una sola fase deben comportarse en una forma análoga a los de un metal puro. Los cristales de una aleación en solución sólida bien recocida, como la de cobre-níquel mencionada anteriormente, aparecen bajo el microscopio igual que las de un metal puro. En todos los puntos donde se encuentran tres granos hay un ángulo diedro intermedio de 120º.
______________________________________________________________________ 129 P.D-S
Fig. 5.17 Tensiones superficiales en los límites de grano en una unión entre dos cristales de la misma fase con un cristal de fase diferente. En las aleaciones de dos fases, son posibles dos tipos de límites: límites que separan cristales de la misma fase y límites que separan cristales de dos fases. Tres granos de una sola fase pueden todavía intersectar en una línea, pero hay la posibilidad adicional de dos granos de una fase que se encuentren con un grano de otra fase en una intersección común. En la Fig. 5.17 se muestra una unión de este tipo. Si las tensiones superficiales en los límites están en equilibrio estático, entonces
σ 11 = 2σ 12 cos
θ
2
en donde σ 11 es la tensión superficial en el límite de la fase simple, σ 12 la tensión superficial en el límite de la fase doble, y θ el ángulo diedro entre los dos límites que separan a la fase 2 de la fase 1. Resolvamos la expresión anterior para la relación de la tensión superficial del límite bifásico a la del límite monofásico. Esto produce
σ 12 1 = σ 11 2 cos θ
2
La relación σ 12 / σ 11 se grafica como una función del ángulo diedro θ en la Fig. 5.18. Obsérvese que al alcanzar la tensión superficial de 0.5, el ángulo diedro cae rápidamente a cero. En la Fig. 5.19 es rápidamente aparente la importancia de los ángulos diedros pequeños, mostrándose la forma de la intersección para ángulos de 10º y 1º. Es bastante aparente que según el ángulo se acerca a cero, la segunda fase se mueve para formar una delgada película entre los cristales de la primera fase. Además, si la tensión superficial del límite bifásico (σ 12 ) cae a un valor menor de ½ de la tensión superficial de la fase simple σ 11 , no es posible el equilibrio estático de las tres fuerzas y el punto o se mueve hacia la izquierda, lo que equivale a decir que cuando el ángulo diedro se vuelve cero, la segunda fase penetra en los límites de la fase simple y aísla a los cristales de la primera fase. Este efecto puede ocurrir aun cuando la fase segunda esté presente en cantidades casi despreciables.
______________________________________________________________________ 130 P.D-S
Fig. 5.18 La dependencia del ángulo diedro bifásico sobre la relación de la tensión superficial bifásica a la tensión superficial de una sola fase. Un buen ejemplo es el caso del bismuto en el cobre. La tensión superficial de la intercara bismuto cobre es tan baja que el ángulo diedro es cero y una cantidad diminuta de bismuto es capaz de formar una película delgada entre los cristales de cobre. Mientras que el cobre es de ordinario un metal de conductividad elevada y capaz de una gran deformación plástica, el bismuto no lo es. De hecho, el bismuto es un metal frágil, y cuando forma una película continua alrededor de los cristales de cobre, éste pierde su ductilidad aun cuando la cantidad total de impurezas de bismuto sea menor del 0.05%. Esta perdida en la ductilidad se observa a todas las temperaturas a las que se trabaja el cobre.
Fig. 5.19 Cuando el ángulo diedro es pequeño, la fase segunda (aún si está presente en pequeñas cantidades) tiende a separar cristales de la fase primera. (A) ángulo diedro 1º, (B) ángulo diedro 10º. En un determinado número de importantes casos metalúrgicos, las impurezas de la segunda fase permanecen en el estado líquido hasta alcanzar una temperatura muy por debajo del punto de solidificación de la fase principal. La cantidad de daño que estas impurezas (en pequeños porcentajes) pueden hacer a las propiedades plásticas de los metales es una función de la tensión superficial entre líquido y sólido. Si esta energía interfacial es
______________________________________________________________________ 131 P.D-S
elevada, el líquido tiende a formar glóbulos discretos con poco efecto sobre las propiedades de trabajo en caliente de los metales. Tomemos el caso del hierro conteniendo pequeñas cantidades de azufre como impureza. El sulfuro de hierro es líquido a temperaturas bien por debajo del punto de solidificación del hierro. Esta zona incluye a la zona de temperaturas utilizadas normalmente para productos de hierro y acero laminados en caliente. Infortunadamente, la energía superficial del sulfuro de hierro en los límites del hierro es muy cercana a la mitad de la del límite entre los cristales de hierro, y el sulfuro líquido forma una película de límites de grano que separa casi completamente a los cristales de hierro. Como un líquido no posee una fuerza real, el hierro o el acero en estas condiciones son frágiles y no pueden ser trabajados en caliente sin que se desintegren. En un caso como éste, cuando un metal se vuelve frágil a temperaturas elevadas, se dice que el metal es “quebradizo en caliente”, esto es, sus propiedades son deficientes a temperaturas de trabajo elevadas. Se ha explicado ya que en una fase segunda en pequeñas cantidades forma delgadas películas intergranulares cuando el ángulo diedro es cero. Para ángulos diedros mayores de cero, pero menores de 60º, la configuración de equilibrio es una, donde pequeñas cantidades de fase segunda corren como una red continua a lo largo de los bordes de grano de la fase primera, a lo largo de líneas donde se encontrarían los tres granos de la fase primera en ausencia de la fase segunda. De acuerdo con la Fig. 5.18, un ángulo diedro de 60º corresponde a una relación de tensiones superficiales interfase a fase simple de 0.582. Muchas intercaras líquido-sólido poseen tensiones superficiales menores de 0.600 de la tensión superficial de límite sólido. Por tanto, cuando coexisten líquidos y sólidos, hay una gran posibilidad de que el líquido formará una malla continua a través del metal. Como la difusión es más rápida en los líquidos que en los sólidos, esta malla forma un paso conveniente para una difusión rápida de los elementos (tanto buenos como malos) hacia el interior del metal. Cuando el ángulo diedro entre los límites de la interfase es mayor de 60º, la fase segunda ya no forma una malla continua a menos que se encuentre presente en la fase principal. La segunda fase, si estuviese presente en pequeñas cantidades, formaría ahora partículas globulares discretas, comúnmente a lo largo de los límites de los cristales de fase primera. Véase la Fig. 5.20. Por debajo de los 1000º C aproximadamente, el sulfuro de hierro ya no es un líquido, sino un sólido. El sulfuro de hierro sólido forma un ángulo de equilibrio con el hierro sólido mayor a 60º y, por tanto, tiende a cristalizar como partículas separadas de FeS en lugar de un película de límite de grano continua. Las partículas pequeñas en fase segunda, aun cuando poseen ser frágiles por sí mismas, son bastantes menos perjudiciales para las propiedades de un metal que las películas continuas de límite de grano frágiles. El hierro que contenga FeS suficiente para hacerlo frágil a temperaturas de trabajo en caliente, retendrá mucha de su dificultad a temperatura ambiente.
______________________________________________________________________ 132 P.D-S
Fig. 5.20 Cuando el ángulo diedro es grande (sobre los 60º), la fase segunda (cuando está presente en pequeñas cantidades) tiende a formar pequeñas partículas separadas, de ordinario en los límites de la fase primera.
5.13.
Esfuerzo cortante del límite de grano
Los metales policristalinos poseen un modo adicional de deformación plástica comparados con los cristales simples, pues ellos pueden deslizarse en relación de unos con otros a lo largo de sus límites. No se comprende bien el mecanismo implicado en este fenómeno debido a la naturaleza complicada de la deformación. Sin embargo, hay varios hechos empíricos notables. La dirección del esfuerzo cortante es la dirección que queda en el límite con el máximo esfuerzo cizallante resuelto. Excepto para límites simples (de ángulo bajo), el esfuerzo cortante de límites de grano implica deformación plástica en cristales que se unen en los límites. En esta forma, de ordinario no hay cizallamiento sobre un plano simple, sino sobre una anchura limitada que se extiende dentro de los cristales sobre ambos lados del límite. Además, el esfuerzo cortante de límites de grano en los metales policristalinos se ha encontrado que es discontinuo, esto es, que el deslizamiento no es uniforme y continuo bajo carga, sino espasmódico e irregular; y ocurre a diferentes grados en puntos distintos a lo largo de un límite, y en cantidades que varían en un punto dado con respecto al tiempo. De esta manera se forman los límites, luego dejan de moverse y, posteriormente pueden moverse de nuevo. Ahora se cree que el esfuerzo cortante irregular en los límites de grano se produce como consecuencia de la deformación no uniforme en el cristal, a causa de que el cizallamiento de límite de grano ocurre únicamente después de un deslizamiento en los cristales. El esfuerzo cortante de límite de grano actúa así para revelar concentraciones de esfuerzos cuando los planos de deslizamiento no corren continuamente desde un cristal al otro en los metales policristalinos. El cizallamiento de los cristales a lo largo de los límites de grano depende de la temperatura. La relación de cizallamiento aumenta rápidamente con la temperatura, mostrando una dependencia sobre la última similar a la de movimiento de los lugares vacantes en los cristales. Se ha admitido, por tanto, que el esfuerzo cortante de límite de grano es controlado por ascenso de dislocación, el cual releva concentraciones de esfuerzos a lo largo de los límites de los cristales. Debido a la gran dependencia de la temperatura del esfuerzo cortante del límite de grano, es únicamente un fenómeno importante a temperaturas elevadas; temperaturas medidas sobre una escala absoluta, que queda entre la temperatura de fusión y aproximadamente una mitad de la temperatura de punto de fusión.
______________________________________________________________________ 133 P.D-S
Referencia Bibliográfica Principios de metalurgia física / por Robert E. Reed-Hill ; [tr. por Antonio Galán Patiño]. México, D.F. : C.E.C.S.A., 1979.
______________________________________________________________________ 134 P.D-S
6. Defectos en cristales Existen muchas razones para estudiar las imperfecciones en los sólidos. Importantes propiedades de los sólidos dependen de los defectos en la estructura atómica y electrónica de los cristales. Por ejemplo, se ha establecido claramente que la difusión en cristales metálicos depende de la presencia de vacantes en la red. La deformación plástica en los metales se le conoce por estar asociada con el movimiento de las dislocaciones. La conductividad eléctrica de muchos sólidos iónicos está asociada con el movimiento de vacantes o iones intersticiales. El comportamiento eléctrico de cristales semiconductores está relacionado a imperfecciones electrónicas. Estas son unas pocas razones para efectuar una discusión acerca de las imperfecciones. Sin embargo, No es necesario mirar solo consideraciones prácticas para justificar su estudio, las imperfecciones son interesantes per se, en cristales, en las mantas orientales, en las estampillas postales, y aún en la gente. En esta sección trataremos imperfecciones cristalinas desde un punto de vista termodinámico. Notemos que las imperfecciones puede ser observadas y analizadas en dos extremos de concentración. Cuando existe baja concentración las imperfecciones están diluidas siendo observadas como entidades particulares más que una naturaleza bien definida. Esto es cierto parta los defectos de punto, tales como, vacantes o átomos intersticiales. Un defecto individual puede interactuar con otros al formar una simple combinación de pares. Esas simples combinaciones pueden ser tratadas como entidades separadas y asignarles entropías suyas propias. En el otro extremo de concentraciones, la densidad de defectos es tan alta que cada uno de los defectos pierde sus propiedades individuales logrando la naturaleza de grupo. Las superficies tales como los bordes de grano, caen dentro de esta categoría. Esos grupos de estructuras pueden asignárseles propiedades del tipo tensión interfacial, que hace su descripción posible en términos termodinámicos.
6.1. Defectos de punto en cristales elementales Un átomo desaparecido en la estructura de un cristal elemental es una vacante o defecto de punto. Si la ausencia de un átomo sobre un sitio de la red no altera el resto del cristal, se puede aplicar el siguiente principio. El cristal consistirá de N átomos y n sitios vacantes en la red. Supongamos que la energía necesaria para crear cada una de esas vacantes esta dada por EV . Por lo tanto hay dos estados en la red a ser considerados: Un estado ocupado E=0 Un estado desocupado
E = EV
La probabilidad de encontrar un estado desocupado está relacionada con la energía requerida para producir la vacancia y la temperatura del cristal, como:
PV = Donde Z = 1 + exp(− E v / kT ) .
exp(− EV / kT ) Z
(2.1)
______________________________________________________________________ 135 P.D-S
PV =
exp(− EV / kT ) n = n + N 1 + exp(− EV / kT )
n − EV = exp N kT
(2.2)
La ecuación 2.2 muestra que las temperaturas por sobre el cero absoluto, los cristales elementales en el equilibrio conteniendo vacantes. Un valor típico, por ejemplo para el aluminio elemental, es EV = 0,75 eV (72,4 kJ / mol ) . Actualmente, la ausencia de un átomo en un sitio de la red cambia los patrones de vibración de los átomos vecinos (figura 2.1). Debemos tomar en cuenta no sólo la energía (o entalpía) requerida para producir vacantes, sino que también los cambios de entropía en el sector que
Fig. 2.1 Efectos de una vacancia sobre los vecinos más cercanos: todos estás adscritos a la vacancia rodea a la vacante. En el equilibrio, la energía libre de Gibbs del cristal está en el mínimo con respecto al número de vacantes presentes a una temperatura y presión constante. La energía libre de Gibbs molar cambia, el ∆G entre el cristal imperfecto (Gi ) y el perfecto (G p ) , es:
∆G = Gi − G p = n∆ H V − T∆ S
(2.3) donde ∆ H V es la entalpía de formación de una vacancia, y n es el número de vacancias. El término de la entropía, ∆ S , se puede expresar como:
∆ S = n∆ S V + ∆ S C
(2.4)
El cambio total en la entropía molar ∆ S es igual a la suma de cambio de entropía requerida para crear la vacancia ∆ S V y la entropía configuracional ∆ S C , la que está relacionada con ______________________________________________________________________ 136 P.D-S
la incertidumbre en la ubicación espacial de vacante en el espacio. Suponiendo una distribución aleatoria de vacantes, este término de entropía configuracional se puede expresar así:
(N + n )! ∆ S C = k ln Ω = k ln N !n!
(2.5)
Ordenando después de aplicar la aproximación de Stirling, podemos escribir una expresión para ∆G en función del número de imperfecciones:
∆G = n(∆ H V − T∆ S V ) − kT [( N + n ) ln( N + n ) − N ln N − n ln n]
(2.6)
El mínimo de ∆G como función del número de imperfecciones es:
n ∂∆G =0 = ∆ H V − T∆ S V + kT ln N +n ∂n T Resolviendo para una fracción de sitios vacantes ( xV ) : n ∆S ∆H V = exp V exp xV = N +n kT k
(2.7)
(2.8)
Generalmente, para las imperfecciones
− ∆H V xi = A exp kT
(2.9)
∆ H V 1 ln xi = ln A − k T
(2.10)
Donde A = θ exp(∆ S V / k ) y θ es un factor del número de cuentas en cristalografía. Notemos que xi = ni / N porque ni << N . Tomando el logaritmo natural a ambos lados de la ecuación, ecuación 2.9 podemos escribir el result6ado de la siguiente forma:
En esta forma es aparente que un gráfico de naturaleza logarítmica de la concentración de defectos (o alguna cantidad o propiedad lineal que depende de ello) en la ordenada, y el inverso de la temperatura absoluta en la abscisa, será una línea recta con una pendiente negativa igual a la entalpía de formación de las imperfecciones dividida por k, que es la constante de Boltzmann (Fig. 3.2). Del análisis anterior, concluimos que las vacantes son una característica de equilibrio en cristales elementales a temperaturas por sobre el creo absoluto. Esas son las llamadas vacantes intrínsecas, debido a que son parte inherente del cristal. La existencia de vacantes solamente del tipo intrínsecas, nos llevará ha observar una linealidad entre ln xi v/s (1 / T ) que se muestra en la figura 2.2.
______________________________________________________________________ 137 P.D-S
Fig. 2.2 Fracción de imperfecciones (vacantes) en función del inverso de la temperatura. La concentración de vacantes puede, sin embargo, estar influenciada por otros factores diferentes a ala temperatura. L adicción de impurezas puede ocasionar el distorsionamiento de la red, creando condiciones de favorecimiento a la concentración de vacancias en lugares cercanos al átomo de impureza mayores que la concentración intrínseca. Las vacancias generadas por factores extraños son llamadas vacantes extrínsecas. La presencia de vacantes extrínsecas generalmente se manifiesta por sí mismo como una desviación de la linealidad de ln xi v/s (1 / T ) , que puede ser apreciada en la figura 2.3.
Fig. 2.3 Fracción de imperfecciones (intrínsecas y extrínsecas) en función del inverso de la temperatura absoluta.
6.2. Verificación experimental de las vacancias En principio podría ser posible determinar valores de ∆ H V y ∆ S V sabiendo el número de imperfecciones como una función de la temperatura. Desafortunadamente, es difícil medir ______________________________________________________________________ 138 P.D-S
el número absoluto de imperfecciones. Es posible, sin embargo, inferir ∆ H V y ∆ S V midiendo el cambio con la temperatura del número de imperfecciones. Una aproximación al problema realmente novedosa y exitosa fue ejecutada por Simmons y Balluffi1 quién afirmó que el volumen de un cristal crece con el aumento de la temperatura por dos razones; el aumento de la vibración termal de los átomos y la creación de vacantes:
∆V = ∆VTh + ∆VV
(2.11) El término ∆VTh se refiere al cambio de volumen a causa del aumento de la vibración termal de los átomos. El término ∆VV , se refiere al cambio de volumen debido a la presencia de vacantes. Es igual al número de vacantes multiplicada por el cambio de volumen introducido por la presencia de una vacante, y se escribe como ∆VV = nV VV . Encontrar el cambio de volumen de ∆VV , a temperatura y presión constante, substituimos para n según las ecuaciones 2.9 y 2.11, y derivamos con respecto a la temperatura:
∂ (nV VV ) ∂ (∆VV ) ∆H V ∆H V = N AVV A exp − = 2 kT kT ∂T P ∂T P Reordenando:
T 2 ∂∆VV N∆ H V = VV ∂T P k
∆H V exp − kT
(2.12)
Tomando el logaritmo natural a ambos lados en la ecuación (3.12), tenemos
T 2 ∂∆VV N∆ H V ln = ln k VV ∂T P
∆H V − kT
[
]
(2.13) v/s 1/T
De la ecuación (3.13), es directo apreciar que el gráfico de ln T / VV ·(∂∆VV / ∂T )P tiene una pendiente de − ∆ H V / k . El valor del término 1 / V (∂VV / ∂T )P se determinó observando la diferencia entre el cambio de las dimensiones externas de un cristal ∆l / l y el cambio en el parámetro de la red ∆a / a a medida que la temperatura del cristal esta cambiando. El término que involucra cambios en el parámetro de red, ∆a / a , está relacionado al cambio en volumen asociado solamente con el aumento de las vibraciones de los átomos. La diferencia entre ambos es el cambio de volumen introducido por la formación de vacancias. Porque el volumen es una función cúbica de una dimensión lineal del cristal, el término ∆VV / V es tres veces el cambio de la fracción lineal.
∆VV ∆l ∆a = 3 − V a l 1
2
(2.14)
Simmons, R. O., Ballufi, R. W., Phys. Rev., 117, 52 (1960) Simmons, R. O., Ballufi, R. W., Phys. Rev., 119, 600 (1960)
______________________________________________________________________ 139 P.D-S
De estos experimentos Simmons y Balluffi infirieron las entalpías de formación y entropías en las vacantes del aluminio, oro y plata (Tabla 2.1) Basándose en tales valores, la fracción calculada de los sitios de la red vacantes (∆n / n ) en el punto de fusión de esos metales, también en la tabla 2.1, muestra ser uno en mil. TABLA 2.1 ENTALPÍA DE FORMACIÓN Y ENTROPÍAS DE VACANTES EN EL ALUMINIO, ORO Y PLATA
Aluminio Oro Plata Fuente: 1.
∆ H V (eV )
∆S V / k
0.75 0.94 1.09
2.2 1.0 1.5
∆n / n (en el punto de fusión) 9×10-4 7.2×10-4 2×10-4
Utilizando tales valores, calcularemos para la plata la fracción de sitios vacantes a 700K. Los valores de la entalpía y entropía de la tabal 2.1 son ∆ H V = 1.09 EV y ∆ S V / k = 1.5 .
n* ∆S ∆H V = exp V exp − N k kT * − 1.09 n = 64 × 10 −9 = exp(1.5) exp −5 N 8.617 × 10 (700 )
(
)
La fracción de sitios vacantes en la red es por lo tanto de aproximadamente 64 partes por billón. La concentración de vacantes es la fracción de sitios vacantes multiplicados por el número de sitios de la red por unidad de volumen, N A / V . Este cálculo, para el caso de la plata es de 3.75×1015 vacantes por centímetro cúbico a 700K.
6.3. Interacciones entre vacantes e impurezas Hemos establecido que las vacancias existen en el equilibrio puro, en los cristales elementales por sobre el cero absoluto de temperatura. La concentración de esas vacantes intrínsecas puede ser calculada utilizando la ec. (2.8), si las entalpías de formación y las entropías son conocidas. La presencia de átomos de impurezas disueltas en el cristal puede influenciar la concentración de vacantes intrínsecas, porque los átomos de impurezas difieren en tamaño a los átomos del solvente, generando que las vacantes sean atraídas a los átomos de impurezas. La concentración total de vacantes por lo tanto podría ser modificada. Para analizar esta situación utilizando la termodinámica estadística, consideremos que una vacante puede existir en dos estados estables, unido a un átomo de impureza (extrínseco) o desunida (intrínseca). La concentración total de vacantes nV es la suma de los dos: *
nV = nV + n1−V
(2.15) * donde nV es la concentración total de vacantes (vacantes por unidad de volumen), nV es una concentración de vacantes intrínsecas, y n1−V es concentración de vacantes extrínsecas. ______________________________________________________________________ 140 P.D-S
El estado de energía de una vacante depende de si está unida o no. Designemos la energía de una vacante sin unir por E 0 y la energía de una vacante unida por E1−V . Con el propósito de nuestro análisis podemos asignar un valor de cero a la energía sin unión: E 0 = 0 . El valor de E1−V será inherentemente negativo a causa de su energía de enlace; esto es, se requiere de una energía para separar la vacante del átomo de impureza y luego crear la vacante sin unión. La razón entre vacantes unidas y desunidas es:
n1−V * nV
E g1−V exp − 1−V kT = Z pf
con Z pf (función de partición) = g * + g1−V exp(− E1−V / kT ) .
n1−V g1−V exp(− E1−V / kT ) = n* g * + g1−V exp(− E1−V / kT )
(2.16)
El valor de la degeneración, g1−V , es el producto de la concentración de impurezas, ni , y Z , el número de coordinación en el cristal, porque la vacante puede adjuntarse por si misma a una impureza a cualquiera de las posiciones vecinas más cercanas2. La degeneración de las vacantes sin unir es el número de sitios de la red no próximos a los átomos de impureza. g1−V = Zni ; g * = N − ni − Zni = N − (Z + 1)ni
n1−V Zni exp(− E1−V / kT ) = * n N − (Z + 1)ni + Zni exp(− E1−V / kT )
(2.17)
Notemos que N >> (Z + 1)ni , y Zni exp(− E1−V / kT ) << N para un ni pequeño:
nV n E = 1 + i Z exp − 1−V * N nV kT
(2.18) Aprender cuán importante puede ser la concentración intrínseca, estimemos algunos de los términos de la ec. (2.18). Tomemos plata a 700K como en el ejemplo anterior. Con el cálculo de la sección 2.2 que vacantes en la plata están presentes en 64 partes por billón a esta temperatura. Es difícil reducir las impurezas (ni ) en la plata a este nivel. Una fracción de impureza típica es 10-3, o 0.1%. En este nivel, suponiendo una energía de enlace razonable (E1−V = −0.1 eV ) , y un número de coordinación de 12, la razón del número total de vacantes a la cantidad de vacantes3 intrínsecas es:
2
La notación habitual para el número de coordinación es la letra Z, que también hemos utilizado para significar función de partición. Para evitar una confusión, la notación de Zpf se utilizó en esta sección para la función de partición. 3 La constante de Boltzmann es 8.617×10-5 eV/K.
______________________________________________________________________ 141 P.D-S
nV 0.1 −3 = + 1 10 ( 12 ) exp (8.617 × 10 −5 )(700) n*
nV = 1.06 n* A un nivel del 1% de impurezas, la razón alcanza el 1.06. Esto nos lleva a la concluir que las impurezas pueden tener un efecto sobre la concentración de vacancias. Basándose en la ec. (2.18), este efecto llega a ser aún más importante a bajas temperaturas.
6.4. Interacciones entre impurezas e imperfecciones Hay una tendencia tanto para los átomos e imperfecciones cristalinas de formar clusters, esperando imperfecciones en las estructura, tales como dislocaciones, y la atracción de unión entre los átomos de impureza en el cristal. Un ejemplo interesante de este enlace se encuentra en las aleaciones de hierro-carbono (acero). Una explicación aceptada para el “yield point” en aceros se basa en la unión de dislocaciones y la ocupación de posiciones intersticiales en la red del hierro, tal como los átomos de carbono. La deformación plástica en un sólido cristalino ocurre cuando las dislocaciones se mueven debido a esfuerzos aplicados. En aleaciones hierro-carbono, los esfuerzos requeridos para comenzar el movimiento de dislocaciones es más alto que el esfuerzo requerido para mantener a ellos en movimiento, entregando distintos yield point. La unión entre dislocaciones y átomos de carbono causa este fenómeno. Los esfuerzos de corte requeridos para romper la dislocación lejos de los átomos de carbono relativamente inmóviles es más grande que el esfuerzo de corte requerido para mantenerlos a ellos moviéndose. Basándose en un razonamiento similar al utilizado en derivar la ecuación 2.18, deberían haber pocos átomos ligados a las imperfecciones a medida que la temperatura crece. De esta manera, el fenómeno de yield point debería llegar a ser menos pronunciado a temperatura mayores. Este es, en efecto, lo que se observa en el sistema hierro-carbono. A temperaturas sobre los 700ºC el yield point esencialmente desaparece. Tratar con el efecto de unión entre impurezas intersticiales a las dislocaciones, nos permite adoptar el mismo tipo de notación utilizada en la sección 2.3. Escribamos:
nV ⊥ g N ⊥ exp(− E N ⊥ / kT ) = n* N g N + g N ⊥ exp(− E N ⊥ / kT )
(2.19)
Donde n * N : Número de átomos de nitrógeno intrínseco en el hierro por centímetro cúbico (solubilidad intrínseca). n N ⊥ : Número de átomos de nitrógeno unidos a las dislocaciones. g N : Número de posiciones en la red disponible para disolver átomos de nitrógeno. g N ⊥ : Número de posiciones en las dislocaciones para disolver átomos de nitrógeno. E N ⊥ : Energía de interacción de nitrógenos disueltos y dislocaciones relativas para disolver nitrógeno en la red (cantidad negativa).
______________________________________________________________________ 142 P.D-S
Notemos que hemos asignado una energía de cero al nitrógeno disuelto, en una posición normal (intersticial). Si podemos asumir que g N >> g N ⊥ , la ec. 2.19 se convierte en
nV ⊥ g N ⊥ exp(− E N ⊥ / kT ) = n* N gN
El número total de átomos de nitrógeno disueltos nT es la suma de n
nT = n* N + n N ⊥ =
g N ⊥ exp(− E N ⊥ / kT ) gN
(2.20) *
N
y nN ⊥ .
(2.21) Es aparente de la ecuación 2.21 que la medida de solubilidad del nitrógeno en el hierro es una función de la concentración de dislocaciones si la energía de interacción E N ⊥ no es cero. Estimemos la magnitud del efecto. Las energías de interacción E N ⊥ , son aproximadamente –0.3 eV. Si una muestra es severamente trabajada en frío (rolled), la densidad de dislocaciones crece hasta un 5×1012 cm/cm3. Para el hierro, el número de posiciones intersticiales por centímetro cúbico es 8.4×1022, o 4.7×107. Suponiendo, por simplicidad, que hubiéramos tratado con dislocaciones de borde, el número de posiciones de dislocación que pueden ser ocupadas por los átomos de nitrógeno es el producto de la densidad de dislocaciones y 4.3×107, o 2.15×1020. Si sustituimos esos valores en la ec. 2.21 a 700K (427ºC), el aumento de solubilidad observada es aproximadamente del 37%. Este efecto debería ser observable, y en efecto, fue observado por Darken. Darken condujo sus experimentos equilibrando muestras de hierro con una mezcla de amoníaco e hidrógeno cerca de los 450ºC. Controlando la razón de amoníaco e hidrógeno, el fijó la actividad termodinámica del nitrógeno, porque la constante de equilibrio K a es determinada por la temperatura:
3 H2 + N 2 P 3/ 2 H2 K a = aN PNH 3 NH 3 =
(2.21)
donde N subrayado indica el nitrógeno disuelto. El número de dislocaciones fue variada por trabajo en frío en las muestras a diferentes niveles. El grado más grande de trabajo en frío, corresponde al nivel mayor de concentración de dislocaciones.
______________________________________________________________________ 143 P.D-S
Fig. 2.4 Nitrógeno disuelto en hierro como una función de la actividad del nitrógeno y el trabajo en frío (imperfecciones) en el hierro. Después de equilibrar las muestras de hierro con la actividad del gas de nitrógeno controlado, Darken encontró una solubilidad mas alta en las muestras con un trabajo en frío mayor (i.e., aquellas con una densidad de dislocaciones más alta). Sus observaciones se presentan en la Figura 2.4.
6.5. Defectos electrónicos Los materiales sólidos puedes ser divididos en tres clases, si estamos hablando en un sentido amplio, refiriéndose a su capacidad de transportar las cargas eléctricas: metales, semiconductores y aisladores. Los metales tiene una alta movilidad de carga (electrones), del orden de 1022 por centímetro cúbico. En el otro extremo de la escala se encuentran los aisladores, presentan una movilidad muy baja del orden de uno por centímetro cúbico. El comportamiento de los electrones en los metales se puede ver en los textos de metalurgia física o en libros de física del estado sólido. La conductividad de los aisladores no es discutida aquí porque, por la naturaleza de los dispositivos, sus propiedades no pueden variar significativamente. Semiconductores son particularmente interesantes porque sus conductividades pueden ser variadas cambiando el medio en el cual ellas existen. Ellas son, por lo tanto, útiles como sensores. Los semiconductores intrínsecos son caracterizados por un gap de energía (banda gap), la que se encuentra en una zona intermedia entre las bandas de valencia y de conducción, o bien comúnmente conocidas como los estados prohibidos para los electrones (Figura 2.5). Para que lleguen a ser activos, en un sentido de conducción, los electrones deben saltar la energía del gap hasta llegar a la banda de conducción. Cuando ellos lo hacen, ellos dejan detrás un agujero u hoyo en la banda de valencia. Tanto los electrones como los hoyos pueden participar en la conducción de las cargas eléctricas. Los semiconductores tienen un rango de conducción de cargas eléctricas que si son tabuladas en la misma escala de los ______________________________________________________________________ 144 P.D-S
aisladores y conductores, podríamos decir que la movilidad de carga es del orden de1010 por centímetro cúbico. Ellos son muy útiles para dispositivos eléctricos, tales como los transistores, o en el caso de los sólidos iónicos, como los sensores, porque el número de carga cambia con la temperatura o con la naturaleza química de la atmósfera en equilibrio con el sólido. En esta sección, estableceremos la relación entre el transporte de carga en elementos cristalinos puros (electrones y hoyos) como una función de la temperatura y el gap de energía del sólido. Si los dos estados para los electrones, tanto en la zona más alta de la banda de valencia y la zona más baja de la banda de conducción no existen límites (es decir, E g es cero) podría ser calculada directamente a través de la aplicación de la estadística de Boltzmann. Sin embargo, la situación es más complicada, por la aplicación del principio de exclusión de Pauli. Solamente un electrón puede ocupar cada estado cuántico del cristal, tomando todos los números cuánticos en cuenta, incluyendo a los espines. Utilizando la estadística de Fermi-Dirac, el número de electrones en la banda de conducción N C está basada en: −1
∞
E − µ N C = ∫ g ( E ) 1 + exp dE kT −∞
(2.23)
Donde µ es el nivel de Fermi en el cristal, E F , y g ( E ) es la densidad de estados entre los niveles de energía E y E + dE . La densidad de estados para los electrones en la banda de conducción puede ser derivada utilizando la misma técnica que se utiliza para determinar la densidad de estados para un gas ideal, esto es, el modelo de la partícula cuántica en una caja. Tomando en cuenta los dos estados para los espines que pueden existir cada uno de los niveles de energía, el resultado para los electrones es 3/ 2
2me * 1/ 2 g ( E ) = 4π 2 (E − E g ) h g ( E ) = Ce (E − E g )H 1/ 2
(2.24)
donde C e = 4π (2me / h 2 ) 3 / 2 y me es la masa efectiva de un electrón en el cristal. Para los hoyos en la banda de valencia, se entrega una aproximación similar: *
*
2 mh * g ( E ) = 4π 2 h
3/ 2
(− E )1/ 2
g ( E ) = C h (− E )
1/ 2
(2.25)
*
donde mh es la masa efectiva de un hoyo en la banda de valencia.
______________________________________________________________________ 145 P.D-S
Fig. 2.5 Ploteo de la densidad de estados g(E) versus E para la conducción de electrones y los hoyos en el semiconductor. Porque el nivel de Fermi está situado en la banda prohibida, y su distancia desde el borde de la banda es comparable en tamaño a kT (la cuales igual a 0.025 eV aproximadamente a temperatura ambiente), podemos aproximar la función de Fermi como sigue:
E − EF E − EF 1 + exp ≈ exp kT kT
(2.26)
Sustituyendo las ecs. 2.26 y 2.24 en 2.23 se obtiene: ∞
N C = Ce ∫ (E − E g )
1/ 2
Eg
(E − E F ) dE exp − kT
(2.27)
Si hacemos el siguiente cambio de variable x = ( E − E g ) / kT , en la ec. 2.27 llega a ser
N C = Ce (kT )
3/ 2
( E g − EF ) ∞ 1/ 2 − x exp − ∫ x e dx kT Eg
(2.28)
Para la integral definida, escribimos ∞
1/ 2 −x x ∫ e dx = 0
1 π 2
______________________________________________________________________ 146 P.D-S
De aquí
me *kT N C = 2 2π 2 h
3/ 2
( E − EF ) exp − g kT
(2.28)
Por un proceso similar, el número de hoyos presentes en la banda de valencia es, * mh kT N h = 2 2π 2 h
3/ 2
E exp − F kT
(2.29) Si estuviéramos tratando con un semiconductor intrínseco- eso es, uno en el cual hay un hoyo dejado detrás para cada electrón en la banda de conducción (impurezas no donor o aceptor)- entonces4,
NC = N h
(2.30)
Sustituyéndose las ecs. 2.28 y 2.29 en 3.30: *
Eg
m 3 EF = + kT ln h* 2 4 me *
(2.31)
*
Además kT es pequeña, y los valores de me y mh no son tan diferentes, el nivel de Fermi puede ser considerado como la mitad del gap para semiconductores intrínsecos. Si pensamos la formación de hoyos y electrones de conducción desde el punto de vista de una reacción química, podemos escribir:
nulo = N C + N h
(2.32) El producto de N C y N h es una función de la temperatura, tanto como lo es la constante de equilibrio, y tiene una expresión de: 3 Eg 2·π ·k * * N C N h = 4 2 (me mh ) 3 / 2 T 3 exp − h kT
(2.33)
Es interesante notar que el término de la energía de Fermi, E F , desaparece de la ec. 2.33, y el producto de N C y N h dependen solamente de la temperatura y de la energía del gap, E g .
6.6. Defectos en compuestos iónicos En las secciones precedentes tratamos con defectos en cristales elementales, donde los átomos eran de la misma especie. En los compuestos iónicos tiene un mínimo de dos elementos, un elemento electropositivo, designado por la letra M , y otro electronegativo designado por X . Las vacancias puede ocurrir tanto en la parte de la red electropositiva como electronegativa. Además, tanto los elementos electronegativos como electropositivos N C , el número de electrones en la banda de conducción, es escrita simplemente como “n”. El número de hoyos N h es escrito como “p”, refiriéndose a una especie de conducción cargada 4
En muchas publicaciones,
positivamente.
______________________________________________________________________ 147 P.D-S
toman posiciones intersticiales en la red. Cada tipo de defecto es discutido en las secciones que siguen. TABLA 2.2 RESUMEN DE LA NOTACIÓN KROGER-VINK Símbolo Definición Átomo del elemento electropositivo M Átomo del elemento electronegativo X Átomo M sobre un sitio M MM Átomo N sobre un sitio M NM Vacancia sobre un sitio M VM Átomo M sobre un sitio intersticial Mi * Ión M cargado positivamente sobre un sitio intersticial (ionizado una vez) Mi **
Ión M cargado positivamente sobre un sitio intersticial (ionizado dos veces)
Vi
'
Ión X cargado negativamente sobre un sitio intersticial (ionizado una vez)
VX
*
Vacancia cargada positivamente (relativa a una red perfecta) sobre el sitio X
Mi
' Vacancia cargada negativamente (relativa a la red perfecta) sobre el sitio M VM Fuente: 2
Para los propósitos de nuestra discusión, adoptaremos la notación de Kroger-Vink. Una forma fácil de entender la notación es considerar que cada defecto de punto se representa Z
por un símbolo con un subíndice y otra supra-índice de la manera siguiente: X Y X representa cual sitio es (V para las vacancias y una notación de elemento si es un elemento). Y representa el tipo de sitio ocupado por X (i para un sitio intersticial, o para un sitio de la red, el símbolo para el elemento que está usualmente ocupando ese sitio de la red). Z representa la carga relativa a la carga iónica normal sobre el sitio Y [cargas positivas están representadas por dots ( * o **, y cargas negativas por primas ( `y ``): una letra minúscula x es algunas ocasiones utilizadas para denotar un átomo neutral]. En el cloruro de plata, AgCl, un ión intersticial es representado como Ag*i . Una vacancia en la red de la plata se representa por V’Ag. Las ecuaciones que describen la formación del defecto o aniquilación deben adherirse a los siguientes principios: 1. Conservación de masa. 2. Conservación de la carga (electroneutralidad). 3. Una razón fija de sitios de M y X según los compuestos que están siendo estudiados.
6.7. Defectos de Frenkel Un tipo de defecto en los sólidos iónicos se forma cuando un ión se ubica en una posición intersticial de la red cristalina y su posición en la estructura está vacante. Este tipo de defecto es llamado defecto de Frenkel. La formación de un defecto de Frenkel por un elemento electropositivo (M) puede ser expresada como una ecuación química: ______________________________________________________________________ 148 P.D-S
MX = M (1−δ ) X + δ ·VM + δ ·M i
(2.34)
En la notación Kroger-Vink, la que utilizaremos, se escribe como: *
M M ; = M i + VM '
(2.35) Suponemos que el átomo intersticial M está ionizado con una carga de +1. La vacancia tiene una carga de –1 relativa a una red perfecta. Si pensamos del cambio expresado en la ec. 2.35 como una reacción química, podemos escribir una constante de equilibrio para:
K1 =
(
)
aM * aV ' M i
aM M
(2.36)
La actividad del material M a M M es muy cercana a la unidad porque solamente pequeñas cantidades de defectos son formados. Utilizando una solución diluida infinitamente como en el estado estándar para las imperfecciones que hacen sus actividades iguales a sus concentraciones5: * ' (2.37) i M 1 Para describir la concentración de esas imperfecciones como una función de la temperatura, sigamos el mismo procedimiento utilizado para cristales elementales, con la complicación que debemos tomar en cuenta entropía configuracional ∆ S C tanto de las vacancias y de
[ ][ ]
K = M ·V
(
)
los intersticios. Hay incertidumbre con respecto a la posición de las vacantes y también en relación a la posición de intersticios. Si suponemos que las ubicaciones de las vacantes y de Intersticios son aleatorias e independientes uno de otro, podemos escribir
( N + nv )! ( N + ni )! ∆ S C = k ln · N n N ! ni ! ! ! v
(2.38)
Donde nv : número de vacantes ni : número de intersticios De la sección precedente 2.1, obtenemos:
nv ni ∆S f · = exp k N + nv N + ni
∆H f exp − kT
pero
nv << N ;
[VM '] = nv ;
ni << N ;
V
(2.39)
[M ] = Vn *
i
i
Para un mol de cristal:
5
Los corchetes cuadrados [ ] denotan concentraciones de las especies en los corchetes.
______________________________________________________________________ 149 P.D-S
[VM ']·[M i
*
]
2 ∆S f NA = 2 exp V k
∆H f exp − kT
(2.40)
La concentración de defecto de Frenkel, [F] es igual a la concentración de intersticios [X i ] o de vacantes [V ] si las dos son iguales, o la raíz cuadrada de su producto:
[F ] = ([VM ']·[M i * ])
1/ 2
∆S f NA exp V 2k
=
∆H f exp − 2kT
(2.41)
Este término [F], es llamado concentración de defecto de Frenkel intrínseco y esta relacionado a la entropía y entalpía de formación del defecto. La explicación anterior se basó en la formación de defectos de Frenkel para elementos positivos (M). Un tratamiento similar se puede realizar, para elementos electronegativos (X).
6.8. Defectos de Schottky – Wagner Un defecto en un cristal iónico puede ser creado teniendo un número equivalente de cargas eléctricas de vacantes creadas en redes electropositivas y electronegativas. Si los elementos electropositivo y electronegativo tienen igual valencia, habrá el mismo número de vacantes en cada una de las redes. Si la valencia de los dos elementos es distinta, el número de vacantes es inversamente proporcional a sus estados de valencia. En el caso de valencias similares estas pueden ser expresadas como una ecuación química del siguiente tipo (el término “null” representa en la red el defecto libre (defect-free)): *
null = V X + VM '
(2.42)
En términos de una constante de equilibrio, este puede ser escrito como sigue:
[ ]
K 2 = V X ·[VM '] *
(2.43) Notemos que el término [M M '] aparece tanto en las ecs. 2.37 y 2.43. Tanto los defectso de Frenkel como de Schottky-Wagner pueden estar simultáneamente en el mismo cristal. El equilibrio químico requiere que tanto el equilibrio como la estequiometría sean satisfechos, que en este caso corresponde a la electroneutralidad entre las especies cargadas. Porque de esas condiciones, podemos escribir:
[V ] = [M ] + [V ] [M ] = [VK ]; [V ] = [VK ] '
*
M
*
i
*
X
*
1
i
X
'
M
[V ] = K ' 2
M
1
+ K2
[VM '] = (K1 + K 2 )1/ 2
(2.44)
2 ' M
(2.45)
Por lo tanto la concentración de vacantes en la red electropositiva depende de la presencia de defectos de Frenkel como de Schottky-Wagner.
______________________________________________________________________ 150 P.D-S
6.9. Defectos extrínsecos e intrínsecos en cristales iónicos Las vacantes existen en equilibrio en los cristales iónicos a temperaturas por sobre el cero absoluto. Esas vacantes inducidas térmicamente en cristales puros M-X son llamadas vacantes intrínsecas. Las vacantes también pueden ser inducidas por iones de impurezas cuyas valencias difieren de las valencias de los iones en el cristal matriz. Esas son llamadas vacantes extrínsecas. Consideremos agregar dicloruro de cadmio (CdCl2) a un cristal de cloruro de sodio (NaCl). De las ecuaciones químicas que describen los compuestos, es aparente que la valencia del ion cadmio en el dicloruro de cadmio es +2. El ión sodio en el CdCl2 tiene una valencia de +1. Una molécula de de CdCl2 ocupa dos sitios aniónicos, un sitio catiónico. Por lo tanto, en una solución diluida de CdCl2 en NaCl, debería haber un ion sodio vacante en la red de M para cada ion cadmio agregado, porque así lo requiere la electroneutralidad (Figura 3.8). Esta condición de electroneutralidad puede ser expresada como sigue:
[VNa '] = [Cd Na * ] + [VCl * ]
(2.46) La concentración de vacantes del ión sodio sobre la red es igual a la concentración de vacantes en la red del cloro más la concentración de iones cadmio. De la ec. 2.46 es claro que si la concentración de iones de cadmio es mucho más grande que * * las vacantes de los iones cloro Cd Na >> VCl , las vacantes en la concentración de iones sodio simplemente iguala la concentración de iones cadmio. En este caso, la concentración de vacantes de iones de sodio es extrínseca; eso es, no es controlada por las propiedades inherentes del cloruro de sodio. Depende de otra condición (viz., la concentración de iones cadmio) y no está relacionada al número intrínseco de vacantes producidas térmicamente. * * Si, sin embargo, la concentración del ión cadmio es muy pequeña VCl >> Cd Na , la concentración de vacantes de iones sodio es igual a la concentración de vacantes de iones cloro, y la concentraciones son intrínsecas- eso es, inducidas térmicamente solamente. Esas relaciones pueden ser ilustradas utilizando las relaciones de equilibrio para defectos de Schottky sobre la red de cloruro de sodio:
([
] [ ])
([ ] [
K S = [VNa '][ · VCl ']
])
(2.47)
Combinado las ecs. 2.46 y 2.47 se obtiene:
[VNa '] = [Cd Na *] +
KS 2 o [V Na '] − [Cd Na *][V Na '] − K S = 0 [VNa ']
La solución a esta ecuación es:
[VNa
[Cd ] + ([Cd ] + 4K '] = Na
Na
)
1/ 2
* 2
*
S
(2.47)
2
______________________________________________________________________ 151 P.D-S
*
Fig. 2.6 Efectos de la adición de CdCl2 (presencia de Cd Na ) sobre el cristal de NaCl. Un cristal de cloruro de sodio con una concentración dada de cloruro de cadmio puede mostrar un comportamiento tanto intrínseco como extrínseco dependiendo de su temperatura. Esto puede ser entendido considerando la ec. 2.47. A temperaturas más altas, el valor de la constante de equilibrio K S puede ser mucho más grande que el valor de
[Cd ] .Si
eso es cierto, entonces [V Na '] = K S y las imperfecciones generadas térmicamente serán más grandes que la concentración del ión cadmio. El cristal mostrará * 2
1/ 2
Na
[
comportamiento intrínseco. Cuando K S es mucho más pequeño que Cd Na
[VNa '] = [Cd Na
*
] , veremos
* 2
] y un comportamiento extrínseco. Este cambio en el comportamiento con la
temperatura se ilustra en la Figura 2.7. En la región intrínseca, las vacantes de los iones de sodio son iguales a las vacantes de iones cloruro. En la regiones extrínsecas, la expresión de equilibrio (ec. 2.43) deben aún ser observadas; por lo tanto las vacantes de los iones de cloruro serán menos que la cantidad calculada para concentraciones de iones de cloruro intrínsecos como se ilustra en la figura 2.7.
______________________________________________________________________ 152 P.D-S
Fig. 2.7 Regiones de vacantes intrínsecas y extrínsecas.
______________________________________________________________________ 153 P.D-S
Referencias Bibliográficas Thermodynamics of Materials, Vol. II, David V. Ragone, John Wiley & Sons. Inc. 1995.
______________________________________________________________________ 154 P.D-S
7. Fractura 7.1. Introducción Entendemos por fractura un fenómeno en el cual una grieta nuclea y se propaga en un material. Si la grieta es preexistente ya no es necesario nuclearla. No interesa el caso de los materiales policristalinos especialmente, si bien la información obtenida de los materiales monocristalinos es fundamental para comprender lo que ocurre en los policristales. En ingeniería también se usan ocasionalmente materiales monocristalinos estructurales, además de ellos se usan mucho en aplicaciones electrónicas, magnéticas, etc. Hay casos en que un metal se rompe por la aplicación de esfuerzos sin que intervenga una grieta, por una ruptura de enlaces, situación en la cual los especialistas prefieren no hablar de fractura. Un ejemplo de ello es la rotura de un monocristal de Zn debido a su deslizamiento simple localizado. Esta situación es de poco interés en ingeniería estructural. Fractura dúctil y frágil Considerando un primer criterio de clasificación, se acostumbra distinguir entre fractura dúctil y frágil. Aquí lo u interesa es si el fenómeno mismo de la fractura es o no acompañado (acompañado o incluso controlado) por la deformación plástica. Veremos que cuando no hay deformación plástica ni siquiera en el ámbito local, cerca de la grieta, no existen mecanismos de nucleación de grietas. Todos los mecanismos de nucleación de grietas dependen de que haya deformación plástica. Así, no hay mecanismos frágiles de nucleación de grietas, solo existen mecanismos dúctiles. Camino de las grietas en los policristales Otro criterio de clasificación de la fractura en un policristal corresponde al camino de la grieta: por los bordes de grano (intergranular o intercristalina) o por dentro de los granos (transgranular o transcristalina). En los complejos casos reales, en policristales monofásicos, también puede haber una combinación de estos tipos de trayectorias. Ejemplos: En la tabla I se presentan ejemplos de casos de fractura, atendiendo a los dos tipos de clasificación antes indicados. Sabemos que normalmente, a bajs temperaturas (menores que 0.5 Tf [K] ), los bordes de grano son más resistentes que los granos de los mismos. Por ello nos interesa el grano fino, para tener mucha superficie de bordes de grano por unidad de volumen de material. Pero, como lo muestran los ejemplos de la Tabla I, esto no es cierto cuando, por ejemplo, estamos en condiciones de fluencia lenta (creep) o bien cuando hay una anormal segregación en los bordes de grano. Tres aspectos de los aceros tipo AISI 1010 0 1020 resulfurados: ¿cuál es su estructura, propiedades y aplicaciones?. El origen de la fragilidad por revenido se sospechó correctamente desde hace muchas décadas, pues se daba en aceros con una cantidad relativamente alta de P y S, después de revenidos en ciertos rangos de temperatura. Hasta hace unos 50 años, la forma de resolver el problema era evitando esas temperaturas de revenido. Después, al perfeccionarse los procesos de fabricación de los aceros, a bajas cantidades de P y S logradas, minimizaron el problema. Hace unos 30 años se confirmó experimentalmente que unas pocas capas ______________________________________________________________________ 155 P.D-S
atómicas de compuestos frágiles segregados en los bordes de grano, eran efectivamente la causa del problema. TABLA I. EJEMPLOS DE TIPOS DE FRACTURA, ATENDIENDO A SU CARÁCTER DÚCTIL/FRÁGIL Y A SU TRAYECTORIA INTER/TRANS GRANULAR
Intercristalina (por borde de grano) Dúctil
Creep (factores: alta temperatura, esfuerzo moderado, tiempo grande): al haber deslizamiento de bordes de grano, allí nuclean y se propagan grietas dúctiles. Aparecen en los bordes entre dos granos y entre tres granos ( a estos últimos se les llama “puntos triples”).
Frágil
Fragilidad en aceros por revenido: ciertas impurezas (P y S, por ejemplo) segregan a los bordes de grano, durante el revenido cuando éste se hace a ciertas temperaturas. Allí, se forman compuestos frágiles a temperatura ambiente.
Transcristalina (por dentro de los bordes de grano) Fractura del Cu y del Acero 1020 a temperatura ambiente en tracción cuasiestática (habitual). Por mecanismos dúctiles, se produce la estricción, con nucleación y coalescencia de microporos (microhoyuelos). En tracción se obtiene la típica morfología de copa y cono. Fractura de aceros ferríticos (cc) a bajas temperaturas (menores de 50ºC, por ejemplo). El cristal se rompe por clivaje, como el diamante. El clivaje es muy importante en la fractura frágil.
7.2. Modelo de Griffith para la propagación de las grietas Introducción Griffith que fue el primero en abordar adecuadamente el rol de la grietas en fractura frágil (1920). Nótese que en la fractura frágil, las grietas se propagan en un campo elástico, puesto que no hay deformación plástica. El problema planteado consiste en considerar que se tiene un material dado, con una grieta de tamaño y geometría conocidos y un nivel de esfuerzo conocido; la pregunta es: bajo tales condiciones, ¿se propagará esa grieta?. Griffith publicó su trabajo, donde modeló la fractura frágil de vidrio, en una revista inglesa de gran prestigio. Pasaron varios años antes de que su contribución fuera apreciada por los ingenieros de esa época, sin embargo abrumados por la ruptura de los componentes de aceros de los puentes, calderas, ejes, etc. No sólo el material abordado por Griffith parecía irrelevante, a primera vista; también su metodología de balance energético hacia difícil la generalización de las aplicaciones a geometrías complejas de grietas. Hoy se reconoce la contribución fundamental de Griffith para la disciplina denominada Mecánica de la Fractura. Enunciado del modelo de Griffith Consideremos un material como el vidrio: - Isótropo - Elástico perfecto. Es elástico lineal y no presenta plasticidad, ver Figura 1. Se aplicarán algunas ecuaciones elementales de Elasticidad Lineal.
______________________________________________________________________ 156 P.D-S
El caso analizado por Griffith se presenta en la Fig. 7.1. Se trata de un plancha de espesor unitario, suficientemente delgada como para que el esfuerzo perpendicular a la plancha sea despreciable. Hay un esfuerzo σ aplicado, que es conocido y constante. Los casos de las Figs. 7.1a y 7.1b son similares a su tratamiento e idénticos en su solución, si se cuida emplear la nomenclatura para el tamaño de la grieta presente en esa figura. En ambos casos la grieta es perpendicular a la dirección del esfuerzo. Lo que se quiere establecer si la grieta se propagará o no, (No se pregunta acerca de cómo apareció la grieta). Modelación Consideremos el caso de Griffith de la Fig. 7.1a. Para resolver el problema se hace un balance de las energías involucradas. Además, la energía de la plancha agrietada se refiere a (compara con) a la de una plancha similarmente solicitada, pero sin la grieta, ver Fig.7.3. Así, primero se calculará:
∆U = U [2a ] − U [0]
Ec. (1) En este cálculo sólo se tomará en cuenta los términos energéticos que presentan diferencias entre las dos planchas. Por ejemplo, no tomaremos en cuenta la energía correspondiente a las superficies libres de las planchas, debido a que tales superficies son iguales en ambas planchas. Nótese que a toda superficie de un material, que es una forma de defecto cristalino, se le asocia una energía específica de superficie γ (erg / cm 2 ). Al estado de referencia, plancha no agrietada, sólo le corresponde una energía elástica almacenada, por unidad de volumen de cristal. Aprovechando un resultado de la teoría de la Elasticidad, para un nivel de esfuerzo σ , se tiene:
1 U [0] = UV [0] = σε VP 2
Ec. (2) Para la plancha, V = S P ·t , donde S P es la superficie de la plancha y t el espesor de ésta; además t = 1 . Aplicando la ley de Hooke ( σ = Eε ), se llega a: 2
1 σ U [0] = 2 E
S P
Ec. (3)
Veamos ahora el cálculo de la energía total de la plancha con una grieta 2ª. Por tener una grieta, esta plancha tiene más superficie que la de referencia. Además, por estar agrietada, parte de su energía elástica está relajada.
U [2a ] = UV [2a ] + U S [2a ]
Ec. (4) Ahora bien, considerando las dos superficies libres enfrentadas asociadas a la grieta, se tiene:
U S [2a ] = (2(2a × t ))γ
Ec. (5)
______________________________________________________________________ 157 P.D-S
El cálculo de U V [2a ] es algo más complejo, pues hay que conocer los campos de esfuerzos y deformaciones en la plancha y luego hay que integrar la energía elástica sobre el volumen. Este es un problema resuelto de elasticidad, pero aquí desarrollaremos una solución aproximada, la que permite llegar rápidamente a una solución que difiere sólo en un factor numérico de la solución exacta; además, en esta solución simplificada, aparecen correctamente todos los parámetros involucrados. Supondremos que la grieta genera un volumen en que los esfuerzos están totalmente relajados, y que fuera de dicho volumen el esfuerzo es una constante igual a σ , el esfuerzo nominal aplicado. La Fig. 7.4 ilustra estos volúmenes en la plancha agrietada. De esta manera, se tiene:
1 σ 2 ( 2a ) 2 π t U S [2a ] = S P − 2 E 4
Ec. (6)
Ahora ya podemos desarrollar la ec. 1:
∆U = U [2a] − U [0]
2 ( 1 σ 2 2a ) π = S P − 2 E 4
2 1 σ t + (2(2a × 1))γ − S P E 2
Lo que da:
1 σ 2 2 ∆U = 4aγ − a π 2 E
( )
Ec. (7a)
Al deducir la ec. 7a, se adoptó una aproximación para considerar la relajación de los esfuerzos en la plancha debido a la presencia de la grieta. Una solución matemática rigurosa indica que subestimamos el término elástico en un factor 2. Por lo tanto, el resultado correcto es: 2 2
σ ∆U = 4aγ − a π E
( )
Ec. (7b)
Tengamos presente que se está trabajando con un material dado (de constantes E y γ ) bajo un esfuerzo constante σ . Analicemos cómo evoluciona ∆U cuando la magnitud a crece, ver Fig. 7.3. Obsérvese que, en el segundo miembro, el primer sumando corresponde a una energía que se opone a la propagación de la grieta, en tanto que el segundo sumando corresponde a una energía elástica liberada. Esta última permite, entre otras cosas, superar la anterior barrera energética haciendo posible la propagación. El primer sumando del segundo miembro crece linealmente con a, en tanto que el segundo sumando, para valores suficientemente grandes de a, decrece muy rápidamente con el cuadrado de a. Esto es, para
______________________________________________________________________ 158 P.D-S
valores pequeños de a, prevalecerá el primer sumando que es positivo; pero, para valores mayores, prevalecerá el segundo sumando que es negativo. Calculemos el valor de a que corresponde al cambio de pendiente de la curva ∆U versus a. Ese punto se asocia a un valor extremo (máximo) de dicha función, que es de concavidad negativa. Derivando e igualando a cero, se obtiene: 2
σ 4γ − 2 (aπ ) = 0 E
de donde:
aC = 2γ
E (σ 2π )
Ec. 8 A este valor del semitamaño de la grieta 2ª se le llama valor crítico. Veamos su interpretación. Interpretación del tamaño crítico de la grieta, aC Supongamos que se tiene una grieta de tamaño a, y que esta varía, por alguna razón, su tamaño en da. Tal valor da no puede ser negativo pues, en un caso como éste, las grietas “no sanan! Espontáneamente, es decir, no se cierran (no se reestablecen los enlaces). Veamos entonces el caso de una grieta de tamaño a que crece en da, teniendo en cuenta nuestros cálculos previos y particularmente la Fig. 7.5. • Si a < aC , al crecer la grieta aumenta la energía del material y la grieta no podrá seguir creciendo espontáneamente (no se dispara más allá de reciente crecimiento en da). • Por el contrario, si a > aC el sistema librará suficiente energía elástica como para seguir pagando el precio energético γ , asociado a crear nuevas superficies por crecimiento de la grieta. Entonces la grieta crecerá espontáneamente y, más aún, como veremos, ellas acelerará. Así, este criterio de propagación de grietas frágiles establece que si a > aC , la grieta se propagará rápidamente. Aceleración de las grietas críticas Nótese que para a > aC , la curva ∆U versus a tiene una pendiente cada vez más negativa, ver Fig. 7.5. Ello se debe a que al crecer a, la energía liberada elásticamente por el volumen se hace cada vez mayor que la energía necesaria para crear las superficies correspondientes, ver Figs. 7.5 y 7.6. Esto contribuye a que cada vez haya más energía excedente, lo cual hace acelerar la grieta, hasta llegar a velocidades próximas a un 40% de la velocidad del sonido de un material. Por esta razón es muy difícil frenar una grieta que superó el valor crítico. Solo se puede hacer si se pone una barrera antes de que ella crezca (acelere) demasiado. Tal rol lo puede desempeñar los bordes de grano; en efecto, se ha observado policristales de Fe sometidos a esfuerzo y luego descargados, que presentan grietas que se extienden dentro de un grano, de
______________________________________________________________________ 159 P.D-S
un borde de grano a otro. Sin embargo, lo habitual es que una vez que una grieta comenzó a propagarse, ya no se frene hasta que la pieza o probeta se rompa totalmente. Criterio de Griffith y la necesidad de una grieta aguda El criterio de Griffith es una condición energética necesaria, pero no suficiente, pues también se requiere que se cumpla otra condición vinculada a que la grieta sea aguda. Esta condición establece que el esfuerzo nominal multiplicado por el coeficiente local de concentración de tensiones en el extremo de la grieta, debe ser suficiente para romper localmente los enlaces atómicos. Por lo tanto, cuando se aplica el criterio de Griffith, se entiende que hay una grieta con extremo agudo que satisface la condición recién expuesta. Cuando se tiene una grieta de tamaño a < aC , si el esfuerzo aplicado es cíclico y moderado, podría tenerse crecimiento por fatiga. Bajo esas condiciones, la grieta crecerá en forma estable por fatiga; sólo cuando el tamaño de ella llegue al valor crítico, se tendrá la propagación rápida final. Esfuerzo crítico, σ C La anterior ec. (8) para aC , se puede analizar en términos de un esfuerzo crítico, σ C . Para ello basta despejar de la referida ecuación. Entonces queda: 1/ 2
2·γ ·E π ·a
σC =
Ec. 9
La ec. 9 permite determinar el esfuerzo para el cual se iniciará la propagación de una grieta de tamaño conocido, bajo las condiciones de la Fig. 7.1, en un material de constantes E y γ. Generalización del modelo de Griffith Como veremos, teniendo en cuenta ciertas modificaciones, el criterio de Griffith es extensible al caso de policristales de metales frágiles, materiales que no son perfectamente elásticos, pues ellos normalmente presentan algún grado de plasticidad en el extremo de la grieta. Tampoco los granos individuales de los metales (monocristales) son isótropos. Resultados de Griffith en la nomenclatura de la mecánica de la fractura Más adelante veremos una introducción del enfoque de la Mecánica de Fractura a problemas como el planteado por Griffith, considerando distintas geometrías de grietas incluso materiales elastoplásticos. A la luz de ese enfoque, la solución al problema de Griffith se puede expresar como se indica a continuación. Primero, rescribiremos la ec. 8 de la manera siguiente: 1/ 2 1/ 2 Ec. 10 C Nótese que el segundo miembro de la ec. (10) depende solo de constantes del material; entonces definimos una magnitud, propia del material, llamada Tenacidad del material (en 1/ 2 M. de Fractura), como K C = (2·γ ·E ) . Por otra parte, el primer miembro reúne a las dos
σ (π ·a )
= (2·γ ·E )
variables del problema de Griffith, σ y a; así, el término K = σ C (π ·a ) se le llama Factor de Intensidades de Tensiones, por razones propias de la M. de Fractura. De esta manera, una grieta se propagará cuando K se haga igual a K C . En este enfoque también se debe reconocer a 2γ como igual a G, factor denominado, en la M. de F., Velocidad Crítica de 1/ 2
______________________________________________________________________ 160 P.D-S
Liberación de Energía de Deformación. El factor 2 en esta última relación tiene que ver con que cuando se crea 1 cm2 de grieta, se crean 2 cm2 de superficies nuevas.
Figura 7.1 Curva de tracción de un material perfectamente elástico lineal, que se rompe frágilmente. Es el caso del vidrio, en un ensayo habitual de tracción a temperatura ambiente.
Figura 7.3 Se calcula la diferencia de energía entre una plancha agrietada (ver Fig. 2) y una plancha sin grieta, de referencia. Las dos planchas son del mismo material y de las mismas dimensiones, y están sometidas a un mismo esfuerzo de tracción, σ .
______________________________________________________________________ 161 P.D-S
Figura 7.4 Aproximación de la relajación del campo de esfuerzos en la plancha agrietada (ver Fig. 2)
Figura 7.5 Dependencia con la magnitud a, de las diferencias de energía entre la plancha agrietada y la no agrietada , a σ constante. La curva de la diferencia total de energía ∆U versus a, presenta un máximo para a = aC . Más allá de ese máximo, la pendiente de esa curva se hace más y más negativa; ello se debe a que se incrementa la liberación de energía elástica almacenada en el volumen del material, ∆U V .
______________________________________________________________________ 162 P.D-S
Figura 7.6 Para dos tamaños de grietas centrales en una plancha, se presenta esquemáticamente el volumen relajado, cuando una grieta crece desde 2ª hasta 2(a + da ) , a esfuerzo constante. Nótese que en este problema la energía elástica liberada es proporcional al volumen relajado.
______________________________________________________________________ 163 P.D-S
Referencias Bibliográficas Notas del Curso: “Comportamiento Mecánico de los Materiales”, dictado por el Dr. Aquiles Sepúlveda. Fracture of engineering brittle materials / Ayal de S. Jayatilaka. London : Applied Science Publishers, 1979.
______________________________________________________________________ 164 P.D-S